Odczyt i rozpoznawanie głosu jest coraz lepszy. Technologie idą na tyle do przodu, że systemy bazujące na detekcji głosu stają się ciekawym sposobem rozwoju wielu rozwiązań. Możemy wydawać naszym urządzeniom polecenia głosowe, ale to nie jedyna korzyść płynąca z czułego nasłuchu. Naukowcy MIT stworzyli ubieralny gadżet, który pozwoli na wydawanie komend i komunikację z komputerami bez głosu, choć przez narząd mowy. AlterEgo to „głosowa” alternatywa dla klawiatury, myszki, czy dotykowego ekranu, ale w wersji dbającej o naszą prywatność.

MIT AlterEgo

Jak to działa? AlterEgo wygląda dosyć przerażająco. Jak szyna na twarzy. W rzeczywistości jest to bardzo czuły zestaw sensorów, dzięki którym można wykryć drobne  ruchy i wibracje. Te z kolei zostają odczytane jako konkretne akcje, więc możliwe staje się używanie głosu niczym szeptu, a nawet jeszcze ciszej, bo bezpośrednio przez skórę i kości. Konstrukcja używa umiejętnego rozłożenia mikrofoników i głośniczków, czyli jest rodzajem słuchawek. Wyglądają dziwnie, ale na ten moment design jest na drugim planie. Najważniejsze jest odpowiednie przyleganie do twarzy.

Wewnątrz wearable (a w zasadzie hearable) zmieszczono elektrody, które monitorują i skanują ruchy twarzy i żuchwy. Czujniki wykrywają najdrobniejsze zmiany sygnałów nerwowo-mięśniowych. Potrzebne są do rozpoznawania werbalizacji poleceń bez wypowiadania słów na głos (przynajmniej w sposób głośny). Brzuchomówcy będą pewnie tu lekko uprzywilejowani. Fachowo nazwano to subwokalizacją. Odpowiedzi komputera dotrą do nas przez dźwięk przewodzony przez kości. Te technologie są akurat w użytku już od kilku lat.

Jak to wykorzystać? MIT proponuje sporo zastosowań. Taka komunikacja jest alternatywą dla poleceń głosowych w miejscach publicznych, gdzie nie lubimy wypowiadać prywatnych wyrażeń głośno. Tak samo w miejscach bardzo głośnych, gdzie nie da się wyrazić wystarczająco czytelnie, bo nasz głos jest zagłuszany hałasami. Wyczuwam też, że jest szansa na użycie tego jako komunikator lub kontroler dla osób z problemami wymowy. W każdym razie, potencjał jest. Projekt ma być wspierany Sztuczną Inteligencją, a więc algorytmami uczącymi się sposobów wymowy użytkownika. Całość przypomina mi technologiczne rozwinięcie ludzkich możliwości w zakresie aparatu mowy, czyli nowoczesny interfejs. Wciąż jednak jest sporo kwestii związanych z pewnymi ograniczeniami AlterEgo, ale prototyp może być stale poprawiany. Naukowcy chcą wytrenować system, by nie reagował jedynie na proste i krótkie komendy, a całe zdania.

źródło: news.mit.com