Mi az a képfeldolgozás és hogyan használják a gépi tanulásban?

62 megtekintés
A képfeldolgozás digitális képek számítógépes elemzését és manipulálását jelenti. A gépi tanulás ezt automatizálja. Algoritmusok képzési adatokból tanulnak, így képeket értelmeznek, objektumokat ismernek fel, képeket osztályoznak és generálnak. Ez jelentősen növeli a képfeldolgozás pontosságát és hatékonyságát.
Hozzászólás 0 tetszik

Képfeldolgozás a gépi tanulásban?

Szóval, képfeldolgozás és gépi tanulás... Nekem ez olyan, mint amikor a fotós sógorom a régi, homályos családi képeket próbálja feljavítani valami varázslatos programmal. Mintha a gép próbálná kitalálni, mit is akartunk látni a képen, amikor még bébik voltunk!

Én úgy képzelem el a képfeldolgozást, mint egy nagyító alatt nézni egy képet. Csak itt nem én nézem, hanem egy számítógép, és nem csak nézi, hanem értelmezi is.

A gépi tanulás meg olyan, mint amikor a kutyámat tanítom ülésre. Mutatok neki sokszor, jutalomfalat, és egyszer csak rájön, hogy mi a feladat. A gépnek is sok képet mutatnak, aztán "rájön", mit lát.

Én például láttam egy alkalmazást (talán tavaly májusban, a Balatonnál próbáltam ki), ami a telefon kamerájával felismerte a madarakat a kertben. Egyszerűen ráfókuszáltam a cinegére, és kiírta, hogy "cinege"! Számomra ez varázslat. Persze, nyilván nem tökéletes, de elképesztő, hogy mire képes a technika manapság.

A lényeg, hogy a gépi tanulás segít a képfeldolgozásnak, hogy okosabb legyen. Nem csak meglátja, hogy van egy macska a képen, hanem azt is, hogy milyen fajtájú, milyen pózban van, és talán még azt is, hogy éhes-e. Komolyan, ez már sci-fi!