Mnoho z nás, poslech tohoto hovoru (v angličtině) si nevšimnou nic zvláštního: je to osoba, která si objedná schůzku u kadeřníka. Problém je v tom, že by tam mělo být něco divného, ​​protože jeden posloucháme konverzace mezi člověkem a strojem v reálném čase.

Odhalení každého překvapilo, protože na rozdíl od jiných oblastí (například rozpoznávání lidí) algoritmy umělé inteligence vždy našly velké limity v porozumění a produkci ústního jazyka, a to natolik, že tato oblast je konfigurována jako skutečná výzva 'umělá inteligence. Nakonec nám všem trvá několik sekund, než rozpoznáme skutečný telefonní hovor od volaného zaznamenaného hlasu. Nebo alespoň dosud.

V prezentačním dokumentu Duplex Google (to je název technologie), kterou si všimneme mnoho výzev, kterým vývojáři čelí (zdá se, že je řešíme) a že my, kteří pracujeme v oblasti verbální komunikace, dobře víme:


  • Na rozdíl od vyhledávání Google je hlasová rezervace mnohem více nepřesný: obsahuje zaváhání, několikrát opakovaná slova, autokorekce. Jedním z úkolů stroje je proto „vyčistit“ signál a extrahovat informační obsah
  • Lidé často mluví rychle a když jsou na telefonu, mohou mít hluk v pozadí. Dalším úkolem stroje je proto identifikovat a izolovat zprávu
  • Obsah může být dvojznačný: jako v příkladu poskytovaném stránkou Google, v angličtině „Ok pro 4“ může znamenat „Ok pro 4: oo“ nebo „Ok pro 4 osoby“. Úkolem stroje je proto tyto možné situace identifikovat a vyjasnit
  • Rozpoznat aspekty pragmatický: stroj někdy musí reagovat na explicitní požadavky, například „Můžete počkat minutu?“, „Můžete opakovat?“, „Můžete to říci písmeno po písmenku?“

Zajímavé je, že vypadat přirozeněji, systém musí být nepřesnější: „dívka“, která jmenuje, používá citoslovce, váhání a přeformulování pouze za účelem přirozenějšího vzhledu.

Naštěstí pro nás, Duplex se bude muset identifikovat jako robot před zahájením telefonického rozhovoru s námi.

Skutečností zůstává, že objevy učiněné k překonání všech výše uvedených obtíží mohou mít obrovský dopad modely porozumění a lingvistické produkce.

Začněte psát a hledejte stisknutím klávesy Enter

chyba: Obsah je chráněn !!
Sdílené čtení