Bajeso tinklai: apibrėžimas, pavyzdžiai ir kaip jie veikia

2025 Autorius: Angel Austin | [email protected]. Paskutinį kartą keistas: 2025-06-01 07:35

Tikėjimas, sprendimų tinklas, Bajeso (ian) modelis arba tikimybe pagrįsta aciklinio grafiko modelis yra variantų schema (statistinio modelio tipas), vaizduojanti kintamųjų rinkinį ir jų sąlygines priklausomybes naudojant nukreiptą aciklinį grafiką (DAG).).

Pavyzdžiui, Bajeso tinklas gali parodyti tikimybinius ryšius tarp ligų ir simptomų. Atsižvelgiant į pastarąjį, tinklą galima naudoti apskaičiuojant galimybę susirgti įvairiomis ligomis. Toliau pateiktame vaizdo įraše galite pamatyti Bajeso tikėjimo tinklo pavyzdį su skaičiavimais.

Efektyvumas

Veiksmingi algoritmai gali atlikti išvadas ir mokytis Bajeso tinkluose. Tinklai, modeliuojantys kintamuosius (pvz., kalbos signalus ar b altymų sekas), vadinami dinaminiais tinklais. Bajeso tinklų, galinčių pavaizduoti ir išspręsti neapibrėžtumo problemas, apibendrinimai vadinami įtakos diagramomis.

Essence

FormaliaiBajeso tinklai yra DAG, kurių mazgai reiškia kintamuosius Bajeso prasme: tai gali būti stebimos reikšmės, paslėpti kintamieji, nežinomi parametrai arba hipotezės. Nes tai labai įdomu.

Bajeso tinklo pavyzdys

Žolę gali sušlapti du įvykiai: aktyvus purkštuvas arba lietus. Lietus turi tiesioginės įtakos purkštuvo naudojimui (būtent, kai lyja, purkštuvas dažniausiai būna neaktyvus). Šią situaciją galima modeliuoti naudojant Bajeso tinklą.

Simuliacija

Kadangi Bajeso tinklas yra pilnas jo kintamųjų ir jų ryšių modelis, jį galima naudoti atsakant į tikimybines užklausas apie juos. Pavyzdžiui, jis gali būti naudojamas atnaujinti žinias apie kintamųjų pogrupio būseną, kai stebimi kiti duomenys (įrodymų kintamieji). Šis įdomus procesas vadinamas tikimybine išvada.

A posteriori pateikia visuotinai pakankamą statistiką atradimo programoms, kai pasirenkamos kintamųjų poaibio reikšmes. Taigi šį algoritmą galima laikyti mechanizmu, leidžiančiu automatiškai pritaikyti Bayeso teoremą sudėtingoms problemoms spręsti. Straipsnio nuotraukose galite pamatyti Bajeso tikėjimo tinklų pavyzdžius.

Išvesties metodai

Dažniausi tikslios išvados metodai yra šie: kintamojo pašalinimas, kuris pašalina (integruojant arba sumuojant) nepastebimąneklausomi parametrai po vieną, paskirstant sumą produktui.

Spustelėkite „medžio“, kuris talpykloje saugo skaičiavimus, kad būtų galima vienu metu pateikti užklausą dėl daugelio kintamųjų ir greitai būtų galima skleisti naujus įrodymus; ir rekursinis atitikimas ir (arba) paieška, leidžiantys kompromisus tarp erdvės ir laiko ir suderinti kintamojo pašalinimo efektyvumą, kai naudojama pakankamai vietos.

Visi šie metodai turi ypatingą sudėtingumą, kuris eksponentiškai priklauso nuo tinklo ilgio. Labiausiai paplitę apytikslių išvadų algoritmai yra mini segmentų pašalinimas, ciklinis įsitikinimų sklidimas, apibendrintas įsitikinimų sklidimas ir variacijos metodai.

Tinklas

Norint visiškai nurodyti Bajeso tinklą ir taip visiškai atspindėti bendrą tikimybių pasiskirstymą, kiekvienam mazgui X būtina nurodyti X tikimybės pasiskirstymą dėl X pirminių.

Sąlyginis X paskirstymas pagal tėvus gali būti bet kokios formos. Įprasta dirbti su diskrečiaisiais arba Gauso skirstiniais, nes tai supaprastina skaičiavimus. Kartais žinomi tik paskirstymo apribojimai. Tada galite naudoti entropiją, kad nustatytumėte vieną skirstinį, kurio entropija yra didžiausia, atsižvelgiant į apribojimus.

Panašiai, specifiniame dinamiško Bajeso tinklo kontekste, sąlyginis latentinio laiko raidos pasiskirstymasbūsena paprastai nustatoma taip, kad būtų maksimaliai padidintas numanomo atsitiktinio proceso entropijos greitis.

Tiesiogiai padidinti tikimybę (arba užpakalinę tikimybę) dažnai yra sudėtinga, nes yra nepastebimų kintamųjų. Tai ypač pasakytina apie Bajeso sprendimų tinklą.

Klasikinis požiūris

Klasikinis požiūris į šią problemą yra lūkesčių maksimizavimo algoritmas, kuris pakaitomis apskaičiuoja nenumatytų kintamųjų tikėtinas vertes, priklausančias nuo stebimų duomenų, su maksimaliai padidindamas bendrą tikimybę (arba užpakalinę reikšmę), darant prielaidą, kad anksčiau apskaičiuota numatoma vertės yra teisingos. Vidutinio reguliarumo sąlygomis šis procesas susilieja su maksimaliomis (arba maksimaliomis a posteriori) parametrų reikšmėmis.

Išsamesnis Bajeso požiūris į parametrus yra traktuoti juos kaip papildomus nepastebėtus kintamuosius ir apskaičiuoti visą užpakalinį pasiskirstymą visuose mazguose, atsižvelgiant į stebimus duomenis, ir tada integruoti parametrus. Šis metodas gali būti brangus ir sukurti didelius modelius, todėl klasikiniai parametrų derinimo būdai tampa prieinamesni.

Paprasčiausiu atveju Bajeso tinklą apibrėžia ekspertas ir tada jis naudojamas išvadoms atlikti. Kitose programose nustatyti užduotis žmogui yra per sunki. Šiuo atveju tarp duomenų reikia sužinoti Bajeso neuroninio tinklo struktūrą ir vietinių skirstinių parametrus.

Alternatyvus metodas

Alternatyvus struktūrinio mokymosi metodas naudoja optimizavimo paiešką. Tam reikia taikyti vertinimo funkciją ir paieškos strategiją. Dažnas balų skaičiavimo algoritmas yra struktūros užpakalinė tikimybė, atsižvelgiant į mokymo duomenis, pvz., BIC arba BDeu.

Laikas, reikalingas išsamiai paieškai, grąžinančiai struktūrą, kuri maksimaliai padidina rezultatą, yra supereksponentinis kintamųjų skaičiumi. Vietos paieškos strategija atlieka laipsniškus pakeitimus, kad pagerintų struktūros įvertinimą. Friedmanas ir jo kolegos svarstė galimybę naudoti abipusę kintamųjų informaciją, kad surastų norimą struktūrą. Jie apriboja pirminių kandidatų rinkinį iki k mazgų ir kruopščiai juose ieško.

Ypač greitas būdas tiksliai ištirti BN - įsivaizduoti problemą kaip optimizavimo problemą ir ją išspręsti naudojant sveikųjų skaičių programavimą. Acikliškumo apribojimai pridedami prie sveikųjų skaičių programos (IP) sprendimo metu pjovimo plokštumų pavidalu. Toks metodas gali išspręsti iki 100 kintamųjų problemų.

Problemų sprendimas

Norint išspręsti problemas su tūkstančiais kintamųjų, reikia kitokio požiūrio. Pirmiausia reikia pasirinkti vieną užsakymą ir tada rasti optimalią BN struktūrą to užsakymo atžvilgiu. Tai reiškia, kad reikia dirbti galimo užsakymo paieškos erdvėje, kuri yra patogi, nes yra mažesnė už tinklo struktūrų erdvę. Tada atrenkami ir įvertinami keli užsakymai. Šis metodas pasirodėgeriausia literatūroje, kai kintamųjų yra daug.

Kitas metodas yra sutelkti dėmesį į skaidomų modelių poklasį, kuriam MLE yra uždarytos. Tada galite rasti nuoseklią šimtų kintamųjų struktūrą.

Norint gauti tikslią, interpretuojamą išvadą, būtina ištirti Bajeso tinklus, kurių plotis yra ribotas - trys linijos, nes blogiausiu atveju pastarųjų sudėtingumas yra eksponentinis medžio ilgiu k (pagal eksponentinės laiko hipotezę). Tačiau, kaip visuotinė grafiko savybė, ji labai padidina mokymosi proceso sudėtingumą. Šiame kontekste K-tree gali būti naudojamas efektyviam mokymuisi.

Plėtra

Bajeso pasitikėjimo tinklo kūrimas dažnai prasideda DAG G sukūrimu, kad X tenkintų vietinę Markovo savybę G atžvilgiu. Kartais tai yra priežastinis DAG. Apskaičiuojami kiekvieno kintamojo sąlyginiai tikimybių skirstiniai tarp jo pirminių G. Daugeliu atvejų, ypač kai kintamieji yra diskretūs, jei bendras X skirstinys yra šių sąlyginių skirstinių sandauga, tada X tampa Bajeso tinklu, atsižvelgiant į G.

Markovo „mazgų antklodė“- tai mazgų rinkinys. Markovo antklodė padaro mazgą nepriklausomą nuo likusio to paties pavadinimo mazgo ruošinio ir yra pakankamai žinių, kad būtų galima apskaičiuoti jo pasiskirstymą. X yra Bajeso tinklas G atžvilgiu, jei kiekvienas mazgas yra sąlygiškai nepriklausomas nuo visų kitų mazgų, atsižvelgiant į jo Markovoantklodė.