Hogyan mondja meg egy gép, hogy mi látható egy képen?

Éppen két évvel ezelőtt a legnagyobb hájp a webkettes szcénában a Riya nevű "arcfelismerő szoftver" körül volt. A projekt azóta is él, sőt, 2006 novemberében a Like indulásával megkísérelték a fejlesztők még egyszer témává tenni az "intelligens vizuális keresés"-t.

Aztán fél évvel később a TED-en prezentálta Blaise Aguera y Arcas a Photosynth technológiát. Talán azóta is az egyik legjobban sikerült előadás tech témában. A technológiát felvásároló Microsoft azóta sem mutatta be, hogyan kívánja a Photosynthet alkalmazni különféle szolgáltatásaiban.


Mindenesetre a Photosynth rávilágított arra, hogy kreatív, innovatív, előremutató ötletek a weben nem csak a Google-tól jöhetnek. Úgyhogy lehetett rá számítani, hogy a Google is megpróbálkozik majd a vizuális tartalmak jobb kiértékelésével. Márcsak azért is, hogy saját keresőjük értékesebb, hasznosabb, jobb lehessen.

Mostani hírek szerint egy új projekt arról szól, hogy megkísérlik a weben fellelhető vizuális tartalmakat valahogyan metaadatokhoz, keresésekhez társítani. Ez pedig - jegyzi meg helyesen a TechCrunch - egy képekre értelmezett PageRanket vetít előre.

Természetesen, akárcsak a microsoftos projekt, a Google-kísérlet is azon bukhat el, hogy a weben fellelhető képi tartalmak döntő többsége egyáltalán nem olyan egyértelmű dolgokat ábrázol, mint a Notre Dame homlokzata vagy az Eiffel-torony.

A képek intelligens, gépek általi kértékelése és metaadatokhoz való rendelése továbbra is inkább egy nagyon szép vágyálomnak tűnik. Valószínűleg a jövőben is inkább a képek "körül" található szöveges tartalmak kiértékelése mutatja majd meg, hogy valószínűleg miről szólhat az adott kép. Vagyis a kép kontextusában (leírásában, metaadataiban, címkéiben, linkelő oldalaiban) kell keresni a kép "értelmét". Nem pedig magában a képben, a kép pixelenkénti "értelmezésében".

Persze ettől függetlenül nagyon szívesen látnék a Photosynthhez hasonló intelligens, könnyűsúlyú szoftveres megoldásokat a webes képmegosztókban, képkeresőkben.
Címkék: videó képmegosztók innováció
2008.04.28. 11:00. írta: hírbehozó

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Legjobb ötlet a Googletől eddig a felhasználók bevonása volt
images.google.com/imagelabeler/
a "problémára. :)

Arcfelismerés már implementálva lett a képkeresőjükbe, de az sem teljesen hibátlan.
Most kipróbáltam a PhotoSynth-et és elég meggyőző. Szerintem lesz ennek jövője
És vajon mikor lesz az, hogy a Youtube-videókban lévő beszédet a rendszer felismeri, és a videók mellé szövegesen odakerül, így lehet bennünk keresni?

Persze beszédfelismerő már van, de ezt összehozni Youtube-bal érdekes lenne.

Érdekes lenne, ha feltörnék a captcha rendszert. Kicsit megszaporodna a spam.
Egy témába vágó (és talán az egyik legjobb) Google Tech Talk:
video.google.com/videoplay?docid=-8246463980976635143
Képfelismero szoftver...

Az nagyon hasznos lessz.

Az ember megy az utcán egy kamera lekapja, és máris tudni fogják, hogy merre van...
ami nekem nagyon tetszik, az a facebook arc-link szolgáltatása.

a képeken be tudod linkelni a bizonyos arcokhoz(négyzetekhez) tartozó profilt. isteni ötlet:D:D