Zaboravite umjetnu inteligenciju koja može crtati slike, najnoviji Googleov AI model može kontrolirati robote. Google je nedavno predstavio Robotics Transformer 2 (RT2), model vision-speech-action (VLA) koji može uzeti tekst i slike i pretvoriti ih u robotske radnje.
"Baš kao što jezični modeli uče iz teksta s weba kako bi naučili opće ideje i koncepte, RT-2 prenosi znanje s web podataka kako bi informirao ponašanje robota", objašnjava Vincent Vanhoeke, voditelj Googleovog odjela za robotiku DeepMind, na svom blogu "Drugim riječima, RT-2 može govoriti poput robota."
Vanhoeke kaže da, iako se chatbotovi mogu obučiti pružanjem informacija o određenoj temi, roboti moraju napraviti korak dalje i "prizemljiti se" u stvarnom svijetu. Kao primjer navodi crvenu jabuku. Ako možete jednostavno objasniti chatbotu što je jabuka, onda bi bot trebao znati sve o njoj i kako je razlikovati od sličnog predmeta, kao što je crvena lopta, a također bi trebao naučiti kako treba podići jabuku u ruci
RT-2 ide korak dalje od Googleovog RT-1 i drugih modela korištenjem podataka s Interneta. Primjerice, ako biste htjeli da prethodni model nešto baci, morali biste ga naučiti što je to smeće i kako ga koristiti. Kod RT-2 je moguće da nećete objasniti što je smeće i kako ga koristiti, ali robot to može sam shvatiti pomoću podataka s interneta.
Zahvaljujući RT-2, roboti mogu učiti, asimilirati stečeno znanje i primijeniti ga u budućim situacijama. Međutim, Google napominje da, kako stoji, ograničenja znače da RT-2 samo može pomoći robotu da poboljša fizičke zadatke koje već zna izvesti, umjesto da ih uči od nule.
Sve u svemu, ovo je veliki korak naprijed i pokazuje nam što bi moglo biti moguće u budućnosti. Za više o tome kako RT-2 radi, Google priča na svom blogu DeepMind.
Pročitajte također:
- Google objavljuje značajku na Android kako biste spriječili neželjeno Bluetooth praćenje
- Pronađen je univerzalni način da se zaobiđu etička ograničenja većine AI modela