A képekben és videókban is kutakodna a Google?

A minap nyilvánosságra került egyik Google-szabadalom azt vetíti előre, hogy hamarosan nem csak képeket, hanem a képekben is kereshetünk a weben. Vagy ha nem is mi, de legalább a crawlerek.
Extracted image text can also be used to improve image searching. The extracted text can be stored as associated with the particular image for use in generating search results in an image search. Additionally, the extracted image text can be combined with location data and indexed to improve and enhance location-based searching. The extracted text can provide keywords for identifying particular locations and presenting images of the identified locations to a user.
Ha belegondolunk, éppen nem teljesen őrültség a képeken található szöveges információkat metaadatokként kezelni. Bár persze a relevanciához az esetek nagy százalékában vajmi keveset ad hozzá a képben fellelt szöveges információ. Vegyünk például egy turistafotót, melyen a háttérben egy csomó fényreklám és hirdetés látható.

A Google szabadalma a képek mellett a videótartalmakat is említi. Akik most a fejüket fogják, hogy a mesterséges intelligencia-őrület a Googleplexet is elérte, nyilván nem járnak messze a valóságtól. Az mindenesetre engem megnyugtat, hogy a Google azt nyilatkozta, nem minden szabadalmi kérelmük véresen komoly. Megesik, hogy olyan ötletekre is benyújtanak szabadalmi kérelmet, melyek érdekesnek tűnnek. Mi fogalmazzunk nyugodtan úgy: a legelszállósabb ötletekre sem mondják a Google-nál azt, hogy nettó faszság. Adnak neki egy esélyt. Max egy év múlva jót röhögnek az egészen.
Címkék: google patent
2008.01.07. 20:15. írta: hírbehozó

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Én a Scientific Americanban olvastam egy éveb belül egy cikket, amiben a Microsoft ennél sokkal fejlettebbnek szándékolt képkeresőjéről volt szó, ez felismerne mondjuk, egy asztali lámpát, és más asztali lámpák képeit dobná ki találatként.

Ezekkel csak az a baj, hogy ugyanezen újságban volt egy másik cikk is, még régebben, ami lényegében arról szólt hogy a beszédalapú telefonos, helpdesk-szerű szerverek egyre kevésbé használnak szintetizált emberi hangot, és egyre inkább, mint azt mi is jól tudjuk, előre beolvasott szövegeket. Halad visszafelé a technika.
én mondjuk a yahoo helyében használnám a flickr feltagelt képeinek adatbázisát úgy, hogy a tag-eket kiemelt keywordökként (és nem az oldalon talált akármilyen szövegként) eltárolnám a képek mellé.
A szintetizált emberi hang természetellenes, nehezebben érthető. Szükség sincs rá egy IVR rendszerben. Már ha ezekre gondolt a cikk.
Olyat eddig is tudott a Google, hogy felismeri az arcokat, lásd:

images.google.com/images?q=brian
vs
images.google.com/images?q=brian&imgtype=face

Várható volt az OCR bevetése.
Hehe, jól körbejárta a világot a téma, miután Bill Slawski talált három vonatkozó szabadalmat :)
Van évente többszáz Google szabadalom és 3-4 évesek vannak köztük amelyekből idáig még semmi nem valósult meg.
Szerintem jóval odébb lesz még az az idő, hogy a Google minden képnek a szöveges tartalmát "extraktálja" és értelmezi.
Neven Vision-t beizzították ilyen munkákra az biztos, miután felvásárolták, de elsősorban a tervezett mobil kereső miatt, ami viszont tényleg érdekes dolog lenne, ha megvalósulna. Ez is egy szabadalom volt, de ez is odébb lesz még 2-3 évvel.
"Ha belegondolunk, éppen nem teljesen őrültség a képeken található szöveges információkat metaadatokként kezelni. Bár persze a relevanciához az esetek nagy százalékában vajmi keveset ad hozzá a képben fellelt szöveges információ."

Szerintem is inkább a "bejegyezzük, aztán lehet, röhögünk rajta" kategóriás a szabadalom.

Induljunk ki a normál, szöveges keresőből ugyanis. A meta adatokat (meta keywords) baromira semennyire nem veszi figyelembe a google egy html doksiban, pontosan azért, mert - egy időben legalábbis - marhára elterjedt volt a metával való bohóckodás black hat seosok körében. AZT marha könnyű volt, és még most is az manipulálni - akkoriban marha könnyű volt ezzel a találati listákon előre kerülni.

Amennyiben bevezetnék azt, hogy a képek szöveges adatait is figyelembe venné a Google, az a képtalálatok esetében visszahozná ugyanezt az érát. Márpedig vannak kimondottan Google képkeresőre szóló SEO megbízások.

Nem tartanám a Google gondolkodásmódjával megegyezőnek, hogy amit kizár a szöveges keresőből, azt belerakná a kép/videó keresőibe. Ennél szerintem sokkal fifikásabb emberkék vannak a Googleplexben.

"akkoriban marha könnyű volt ezzel a találati listákon előre kerülni."

Pontosítás: természetesen már akkor sem a Google listáiban, hanem az egyéb, akkoriban elterjedt keresőkben. A Google eleve más alapon (bejövő linkek száma javarészt + szövegelemző algoritmusok) állította össze a találati listát.
a rendőrség évek óta felismeri a képben és a videóban a szöveget, mint rendszámot, akkor ez miért olyan nagy szám

egyébként az a szoftver, a recognita, ha jól tudom egy magyar cucc és a világon az első ilyen típusú szoftver volt/van
Ott azért be lehet lőni előre a körülbelüli méreteket, karaktertípusokat, minőséget stb-t amire számítani lehet.
Klasz, ez majd jol megkonnyiti a spamekben valo keresest :).

> Megesik, hogy olyan ötletekre is benyújtanak
> szabadalmi kérelmet, melyek érdekesnek tűnnek.

Na es akkor ezt gyorsan vessuk ossze a "don't be evil" iranyelvukkel... Latszolag ez olyan jopofa dolog valojaban egy mocskos jatek. Pont olyan, mint az indianok foldjet vagy a Holdat felparcellazni, illetve domain neveket ezrevel bejegyezgetni. Csak azoknal talan egy-ket nagysagrenddel kartekonyabb.

Foleg ultra gusztustalan, ahogy ezek a szabadalmak meg vannak fogalmazva, hogy minel nagyobb teruletet fedjenek le minel kevesebb konkretum elarulasaval. Nem ritkan valos megoldas nelkul. :(
Gyuszibacsi: a rendszamot konnyebb azert eszrevenni egy kepen, mivel mindig azonos a szerkezete (vilagos hatter, sotet betuk, betuk relativ merete, betutipus adott, stb.)
Én inkább majd azt várom, amikor MD5 vagy valami hasonló alapján lehet képeket keresni.

Tehát van egy képem, és meg akarom tudni, hogy hol található meg az interneten (bájtról bájtra azonosan).