Daugiamatis mastelio keitimas: apibrėžimas, tikslai, uždaviniai ir pavyzdys

Turinys:

Daugiamatis mastelio keitimas: apibrėžimas, tikslai, uždaviniai ir pavyzdys
Daugiamatis mastelio keitimas: apibrėžimas, tikslai, uždaviniai ir pavyzdys
Anonim

Daugiamatis mastelio keitimas (MDS) yra įrankis, leidžiantis vizualizuoti atskirų atvejų panašumo lygį duomenų rinkinyje. Tai susiję su susijusių ordinavimo metodų rinkiniu, naudojamu informacijos vizualizavimui, ypač atstumo matricoje esančiai informacijai rodyti. Tai yra netiesinio matmenų mažinimo forma. MDS algoritmu siekiama, kad kiekvienas objektas būtų patalpintas į N matmenų erdvę taip, kad atstumai tarp objektų būtų išsaugoti kuo geriau. Tada kiekvienam objektui priskiriamos koordinatės kiekviename iš N matmenų.

MDS diagramos matmenų skaičius gali viršyti 2 ir yra nurodytas a priori. Pasirinkus N=2, 2D sklaidos diagramoje optimizuojamas objektų išdėstymas. Daugiamačio mastelio keitimo pavyzdžius galite pamatyti straipsnio nuotraukose. Pavyzdžiai su simboliais rusų kalba yra ypač iliustratyvūs.

Daugiamatis mastelio keitimas
Daugiamatis mastelio keitimas

Essence

Daugiamačio mastelio keitimo metodas (MMS,MDS) yra išplėstinis klasikinių įrankių rinkinys, apibendrinantis praradimo funkcijų rinkinio optimizavimo procedūrą ir žinomų atstumų įvesties matricas su svoriais ir pan. Šiame kontekste naudinga praradimo funkcija vadinama stresu, kuri dažnai sumažinama taikant procedūrą, vadinamą streso didinimu.

Rankinis

Yra keletas daugiamačio mastelio keitimo parinkčių. MDS programos automatiškai sumažina apkrovą, kad gautų sprendimą. Nemetrinio MDS algoritmo esmė yra dvigubas optimizavimo procesas. Pirmiausia reikia rasti optimalią monotoninę artumo transformaciją. Antra, konfigūracijos taškai turi būti optimaliai išdėstyti taip, kad jų atstumai kuo tiksliau atitiktų mastelio artumo reikšmes.

Daugiamačio mastelio keitimo pavyzdys
Daugiamačio mastelio keitimo pavyzdys

Plėtra

Metrinio daugiamačio mastelio išplėtimas statistikoje, kai tikslinė erdvė yra savavališka sklandi ne euklido erdvė. Kai skirtumai yra atstumai paviršiuje, o tikslinė erdvė yra kitoks paviršius. Teminės programos leidžia rasti priedą su minimaliu vieno paviršiaus iškraipymu į kitą.

Žingsniai

Yra keli žingsniai atliekant tyrimą naudojant daugiamatį mastelį:

  1. Problemos formulavimas. Kokius kintamuosius norite palyginti? Kiek kintamųjų norite palyginti? Kokiais tikslais tyrimas bus naudojamas?
  2. Gauti įvesties duomenys. Respondentams užduodama keletas klausimų. Kiekvienai produktų porai prašoma įvertinti panašumą (dažniausiai 7 balų Likerto skalėje nuo labai panašių iki labai nepanašių). Pirmas klausimas gali būti skirtas Coca-Cola/Pepsi, pavyzdžiui, kitas – alaus, kitas – Dr. Pepper ir pan. Klausimų skaičius priklauso nuo prekių ženklų skaičiaus.
Atstumo mastelio keitimas
Atstumo mastelio keitimas

Alternatyvūs metodai

Yra du kiti būdai. Yra metodas, vadinamas „Suvokimo duomenys: išvestinis metodas“, kai produktai suskaidomi į atributus ir įvertinimas atliekamas semantine diferencine skale. Kitas metodas yra pirmenybių duomenų metodas, kai respondentų klausiama apie pageidavimus, o ne apie panašumus.

Ją sudaro šie veiksmai:

  1. Paleidžiama MDS statistikos programa. Programinė įranga procedūrai atlikti yra daugelyje statistikos programinės įrangos paketų. Dažnai galima rinktis tarp metrinės MDS (kurios susijusios su intervalų arba santykio lygio duomenimis) ir nemetrines MDS (kurios susijusios su eiliniais duomenimis).
  2. Matavimų skaičiaus nustatymas. Tyrėjas turi nustatyti, kiek matavimų jis nori sukurti kompiuteryje. Kuo daugiau matavimų, tuo geresnis statistinis atitikimas, bet tuo sunkiau interpretuoti rezultatus.
  3. Rodyti rezultatus ir apibrėžti matavimus – statistinė programa (arba susijęs modulis) parodys rezultatus. Žemėlapyje bus rodomas kiekvienas produktas (dažniausiai 2D formatu).erdvė). Produktų artumas vienas prie kito rodo jų panašumą arba pirmenybę, atsižvelgiant į tai, koks metodas buvo naudojamas. Tačiau ne visada aišku, kaip matavimai iš tikrųjų atitinka sistemos elgsenos matavimus. Čia galima priimti subjektyvų atitikties sprendimą.
  4. Patikrinkite rezultatų patikimumą ir pagrįstumą – apskaičiuokite R kvadratą, kad nustatytumėte mastelio duomenų dispersijos proporciją, kurią galima įvertinti naudojant MDS procedūrą. Kvadratas R 0,6 laikomas minimaliu priimtinu lygiu. R kvadratas 0,8 laikomas tinkamu metriniam mastelio keitimui, o 0,9 – nemetriniam mastelio keitimui.
Daugiamatis mastelio keitimo rezultatai
Daugiamatis mastelio keitimo rezultatai

Įvairūs testai

Kiti galimi testai yra Kruskal tipo testavimas nepalankiausiomis sąlygomis, suskaidytų duomenų testai, duomenų stabilumo testai ir pakartotinio patikrinimo patikimumo testai. Išsamiai parašykite apie testo rezultatus. Kartu su kartografavimu turėtų būti nurodytas bent atstumo (pvz., Sorensono indeksas, Jaccard indeksas) ir patikimumo (pvz., įtempių vertės) matas.

Taip pat labai pageidautina pateikti algoritmą (pvz., Kruskal, Mather), kurį dažnai nustato naudojama programa (kartais pakeičiant algoritmo ataskaitą), jei nurodėte pradinę konfigūraciją arba atsitiktinai pasirinkote skaičių. matmenų paleidimų, Monte Karlo rezultatų, iteracijų skaičiaus, stabilumo balo ir proporcingos kiekvienos ašies dispersijos (r kvadratas).

Vizualinės informacijos ir duomenų analizės metodasdaugiamatis mastelio keitimas

Informacijos vizualizacija – tai interaktyvių (vaizdinių) abstrakčių duomenų atvaizdų tyrimas, siekiant pagerinti žmogaus pažinimą. Abstraktūs duomenys apima ir skaitmeninius, ir neskaitinius duomenis, tokius kaip tekstinė ir geografinė informacija. Tačiau informacijos vizualizacija skiriasi nuo mokslinės vizualizacijos: „tai yra informacinė (informacinė vizualizacija), kai pasirenkamas erdvinis vaizdas, o scivis (mokslinė vizualizacija), kai pateikiamas erdvinis vaizdas“.

Informacijos vizualizacijos sritis atsirado tyrinėjant žmogaus ir kompiuterio sąveiką, kompiuterių mokslo programas, grafiką, vizualinį dizainą, psichologiją ir verslo metodus. Jis vis dažniau naudojamas kaip esminis mokslinių tyrimų, skaitmeninių bibliotekų, duomenų gavybos, finansinių duomenų, rinkos tyrimų, gamybos kontrolės ir kt. komponentas.

Metodai ir principai

Informacijos vizualizacija rodo, kad vizualizacijos ir sąveikos metodai išnaudoja žmogaus suvokimo turtingumą, todėl vartotojai gali vienu metu matyti, tyrinėti ir suprasti didelius informacijos kiekius. Informacijos vizualizacija siekiama sukurti būdus, kaip intuityviu būdu perduoti abstrakčius duomenis, informaciją.

Daugiamatis spalvų mastelio keitimas
Daugiamatis spalvų mastelio keitimas

Duomenų analizė yra neatsiejama visų taikomųjų tyrimų ir problemų sprendimo pramonėje dalis. DaugumaPagrindiniai duomenų analizės metodai yra vizualizacija (histogramos, sklaidos diagramos, paviršiaus diagramos, medžių žemėlapiai, lygiagrečios koordinačių diagramos ir kt.), statistika (hipotezių tikrinimas, regresija, PCA ir kt.), duomenų analizė (atitikimas ir kt.)..d.) ir mašininio mokymosi metodai (grupavimas, klasifikavimas, sprendimų medžiai ir kt.).

Tarp šių metodų informacijos vizualizavimas arba vizualinė duomenų analizė labiausiai priklauso nuo analitinių darbuotojų pažintinių įgūdžių ir leidžia atrasti nestruktūrizuotas veiksmingas įžvalgas, kurias riboja tik žmogaus vaizduotė ir kūrybiškumas. Analitikui nereikia mokytis jokių sudėtingų metodų, kad galėtų interpretuoti duomenų vizualizacijas. Informacijos vizualizacija taip pat yra hipotezių generavimo schema, kuri gali būti ir paprastai yra lydima analitiškesnės ar formalesnės analizės, pavyzdžiui, statistinės hipotezės tikrinimo.

Studijuoti

Šiuolaikinis vizualizacijos tyrimas prasidėjo nuo kompiuterinės grafikos, kuri nuo pat pradžių buvo naudojama mokslinėms problemoms tirti. Tačiau pirmaisiais metais grafikos galios trūkumas dažnai ribojo jos naudingumą. Pirmenybė buvo teikiama vizualizacijai sukurti 1987 m., išleidus specialią programinę įrangą, skirtą kompiuterinei grafikai ir vizualizacijai moksliniame skaičiavime. Nuo tada buvo surengtos kelios konferencijos ir seminarai, kuriuos kartu surengė IEEE Computer Society ir ACM SIGGRAPH.

Jie apėmė bendras duomenų vizualizavimo, informacijos vizualizavimo ir mokslinės vizualizacijos temas,taip pat konkretesnės sritys, pvz., apimties atvaizdavimas.

Daugiamatis prekės ženklo mastelio keitimas
Daugiamatis prekės ženklo mastelio keitimas

Santrauka

Generalizuotas daugiamatis mastelio keitimas (GMDS) yra metrinio daugiamačio mastelio pratęsimas, kuriame tikslinė erdvė yra ne euklido. Kai skirtumai yra atstumai paviršiuje, o tikslinė erdvė yra kitas paviršius, GMDS leidžia rasti vieno paviršiaus įdėjimą į kitą su minimaliais iškraipymais.

GMDS yra nauja tyrimų kryptis. Šiuo metu pagrindinės programos yra deformuojamų objektų atpažinimas (pavyzdžiui, 3D veido atpažinimas) ir tekstūros atvaizdavimas.

Daugiamačio mastelio keitimo tikslas yra pateikti daugiamačius duomenis. Daugiamačius duomenis, ty duomenis, kuriems pateikti reikia daugiau nei dviejų ar trijų dimensijų, gali būti sunku interpretuoti. Vienas iš supaprastinimo būdų yra manyti, kad dominantys duomenys yra įterptame netiesiniame kolektorius didelės dimensijos erdvėje. Jei kolektoriaus matmenys yra pakankamai žemi, duomenis galima vizualizuoti mažo matmens erdvėje.

Daugelis netiesinių matmenų mažinimo metodų yra susiję su tiesiniais metodais. Netiesinius metodus galima iš esmės suskirstyti į dvi grupes: tuos, kurie suteikia atvaizdavimą (nuo didelės erdvės iki mažo matmens įterpimo, arba atvirkščiai), ir tuos, kurie tiesiog suteikia vizualizaciją. Mašininio mokymosi kontekste žemėlapių sudarymo metodai gali būti vertinami kaippreliminarus bruožų išgavimo etapas, po kurio taikomi modelio atpažinimo algoritmai. Paprastai tie, kurie tik pateikia vizualizacijas, yra pagrįsti artumo duomenimis – t.y. atstumo matavimais. Daugiamatis mastelio keitimas taip pat gana įprastas psichologijoje ir kituose humanitariniuose moksluose.

Įstrižainės daugiamatis mastelio keitimas
Įstrižainės daugiamatis mastelio keitimas

Jei atributų skaičius yra didelis, tada unikalių galimų eilučių erdvė taip pat yra eksponentiškai didelė. Taigi, kuo didesnis matmuo, tuo sunkiau pavaizduoti erdvę. Tai sukelia daug problemų. Algoritmai, veikiantys naudojant didelio masto duomenis, paprastai būna labai sudėtingi. Sumažinus duomenis iki mažesnių matmenų, analizės algoritmai dažnai tampa veiksmingesni ir gali padėti mašininio mokymosi algoritmams atlikti tikslesnes prognozes. Štai kodėl daugiamatis duomenų mastelio keitimas yra toks populiarus.

Rekomenduojamas: