FormadoMalĉefa eduko kaj lernejoj

Plej proksima najbaro metodo: ekzemplo de laboro

la plej proksima najbaro metodo estas la plej facila metriko klasifikilo kiu estas bazita sur la taksado de la simileco de diversaj objektoj.

Analizis objekto apartenas al la klaso al kiu ili apartenas temoj de trejnado specimeno. Ni eltrovi kiun estas la plej proksima najbaro. Provu kompreni la komplika afero, ekzemploj de malsamaj teknikoj.

hipotezo metodo

plej proksima najbaro metodo povas esti konsiderata kiel la plej ofta algoritmo uzita por klasifiko. Objekto spertas klasado apartenas al la klaso y_i, al kiu la plej proksima objekto lernanta x_i specimeno.

Specifecon de metodoj plej proksimaj najbaroj

k plej proksima najbaro metodo povas plibonigi la precizecon de klasifiko. Analizis objekto apartenas al la sama klaso kiel la kernon de ties najbaroj, tio estas, k proksime al ĝi objektojn de la analizitaj specimeno x_i. En solvi problemojn kun du klasoj de la nombro de najbaroj estos stranga por eviti situacion de ambigueco, se la sama numero de najbaroj apartenas al diversaj klasoj.

La tekniko de nuligita najbaroj

Postgresql-analizitaj metodo tsvector plej proksimaj najbaroj estas uzata kiam la nombro de klasoj almenaŭ tri, kaj vi ne povas uzi nepara nombro. Sed ambigueco ekestas eĉ en tiuj kazoj. Tiam, la ia najbaro ricevas w_i pezo, kiu malpliiĝas kun la najbaro rango i. Ĝi rilatas al la klaso de la objekto, kiu havos maksimuman totala pezo inter proksimaj najbaroj.

La hipotezo de kompakteco

La fundamento de ĉiu el tiuj ĉi metodoj estas la hipotezo de kompakteco. Ĝi sugestas ligon inter la mezuro de la simileco de objektoj kaj iliaj apartenantaj al la sama klaso. En ĉi tiu situacio, la limo inter la malsamaj tipoj estas simpla formo, kaj krei klasojn de objektoj en spaco kompaktan porteblaj areo. Sub tiaj areoj en analitiko prenita por signifi fermita barita aro. Tiu hipotezo ne estas rilatigita kun la ĉiutaga percepto de la vorto.

La baza formulo

Ni rigardu pli proksima najbaro. Se la proponita trejnado specimeno tipo "celo-respondo» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; se pluralidad de objektoj difini la distanco funkcio \ rho (x, x '), kiu estas reprezentita en la formo de taŭgan modelon similecon de objektoj de pliiganta la valoron de la funkcio malgrandiĝas simileco inter objektoj x, x'.

Por ajna celo, u konstruos trejnado specimeno celoj x_i kun kreskanta distancoj al u;

\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}),

kie x_ {i; u} karakterizas la celon lernado specimeno, kiu estas ia najbaro fonto objekto u. Tia skribmaniero kaj uzo respondi al ia najbaro: y_ {i; u}. Rezulte, ni trovas, ke iu objekto u provokas renumerado propra specimeno.

Determino de la nombro k de najbaroj

plej proksima najbaro metodo kiam k = 1 kapablas doni erara klasifiko, ne nur sur objektoj-emisioj, sed ankaŭ por aliaj klasoj, kiuj estas proksimaj.

Se ni prenas k = m, la algoritmo estos kiel stabilan kaj degeneros en konstanta valoro. Tial fidindeco estas grava por eviti ekstreman indeksoj k.

Praktike, kiel la optimuma indekso k uzata kriterio glitante kontrolo.

rastrumoj emisiones

La celoj de studo estas plejparte neegalaj, sed inter ili estas tiuj, kiuj havas la karakterizaĵojn de klaso kaj estas nomata kiel normoj. En proksimeco de la subjekto al la ideala modelo de lia alta probablo de posedaĵo al ĉi tiu klaso.

Kiel rezultativen metodo de plej proksimaj najbaroj? Ekzemplo povas vidi surbaze de ekstercentraj kaj ne-informa kategorioj de objektoj. Ĝi supozas densa medio de la objekto aliaj reprezentantoj de tiu ĉi klaso. Kiam vi forigas ilin de la klasifiko de muestreo la kvalito ne suferos.

Akiri en unu nombro de specimenoj povas bruo krevas kiuj estas "surgrunde" de klaso. Forigado substance pozitivan efikon sur la kvalito de la klasifiko.

Se la specimeno prenita de la uninformative kaj elimini bruo objektoj, vi povas kalkuli je kelkaj pozitivaj rezultoj samtempe.

La unua interpolo metodo de la plej proksima najbaro klasifiko permesas plibonigi la kvaliton, redukti la kvanton de datumoj stokitaj, redukti la tempon de klasifiko, kiu estas elspezita por la elekto de la sekva normoj.

La uzo de ultra granda specimenoj

plej proksima najbaro metodo estas bazita sur la reala stokado de lernado objektoj. Por krei tre grandskalajn specimenoj uzante teknika problemo. La celo estas ne nur por ŝpari signifan kvanton de informoj, sed ankaŭ en la minimuma kvanto de tempo por havi tempon por trovi ajnan celon u k inter la plej proksimaj najbaroj.

Por elteni tiun taskon, du metodoj estas uzataj:

  • malplipeziĝita specimeno pere elfluon ne-datumoj objektoj;
  • efika uzo speciala datumstrukturo kaj kodojn por momenteto serĉo de la plej proksimaj najbaroj.

Reguloj de elekto metodoj

La supre klasifiko estis konsiderita. Plej proksima najbaro metodo estas uzata por solvi praktikan problemojn, kiuj estas konata anticipe la distanco funkcio \ rho (x, x '). En priskribado objektoj nombra vektoroj uzi Eŭklida metriko. Tiu elekto ne speciala pravigo, sed implikas la mezuron de ĉiuj signoj "en la sama skalo." Se ĉi tiu faktoro ne estas prenita en konto, tiam la metriko estos superregas trajto havi plej alta nombraj valoroj.

Se estas granda kvanto de funkcioj, kalkulante la distanco kiel la sumo de la devioj de specifaj simptomoj aperas grava problemo dimensio.

En alta dimensia spaco malproksima unu de la alia volo ĉiuj objektoj. Finfine, ĉiu specimeno estos apud la objekto studita k najbaroj. elektitaj malmulto de informa trajtoj elimini tiun problemon. Algoritmoj por kalkulado de taksoj konstrui surbaze de malsamaj aroj de signoj, kaj por ĉiu individua konstrui ilian proksimecon funkcio.

konkludo

Matematikaj ŝtonoj ofte implikas la uzon de diversaj teknikoj kiuj havas proprajn karakterizajn karakterizaĵojn, avantaĝoj kaj malavantaĝoj. Vidita plej proksima najbaro metodo povas solvi tre grava problemo, pro la karakterizaĵoj de matematikaj objektoj. La eksperimenta koncepto, bazita sur la analizitaj metodo estas aktive uzita en artefarita inteligenteco.

En la spertaj sistemoj estas necesa ne nur por klasifiki objektoj, sed ankaŭ montras la uzanto klarigon de la klasifiko en demando. En ĉi tiu metodo, klarigon de ĉi tiu fenomeno estas esprimitaj rilate al la objekto de iu klaso kaj ankaŭ ĝia loko relative al la specimeno uzita. Leĝa industrio specialistoj, geologoj, kuracistoj, prenu ĉi "precedenco" logiko aktive uzas ĝin en siaj esploroj.

Por esti analizita metodo estis la plej fidinda, efika, donante la deziratan rezultoj, vi devas preni minimumon figuro k, dum ankaŭ eviti emisiones inter la analizita objektoj. Tial la uzo de normoj kaj la elekto metodo, kaj ankaŭ la optimización metrikoj.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 eo.atomiyme.com. Theme powered by WordPress.