O nich będzie głośno. Stworzyli pierwszy inteligentny głośnik rozumiejący komendy po polsku

Konrad Siwik

13 września 2019, 11:21

Inteligentne głośniki dostępne na rynku niechętnie uczą się języka polskiego. Już dawno doszedł do tego zespół odpowiedzialny za pierwszy na świecie inteligenty głośnik rozumiejący komendy w języku polskim.

Założycielem projektu jest Andrzej Raczkowski – główny architekt i programista. • Fot. materiały prasowe

Techniczna uwaga - Asystent głosowy Google również rozumie komendy po polsku, ale ograniczony jest do telefonów - nie działa po polsku np. na inteligentnych głośnikach Google Home.

O twórcach tego głośnika pisaliśmy w INNPoland.pl, gdy byli na początku swojej drogi. Teraz przychodzi moment sprawdzianu.

Przypomnijmy, że pierwotnie miał to być prosty sprzęt domowy sterowany głosem. Z czasem w ramy funkcjonalności weszła również możliwość udostępniania innych treści audio, jak podcasty czy audiobooki. W międzyczasie ekipa odpowiedzialna za głośnik, wypuściła system do zarządzania tzw. inteligentnym domem. Teraz, w końcu dowiedzieliśmy się, że AI-Speaker jest już niemal gotowy i aktualnie przechodzi ostateczne testy. O szczegółach opowiedziała nam Celina Raczkowska, Customer Development Manager AI-Speaker.

Jakie zmiany wprowadziliście w sprzęcie?

Kiedy zaczęliśmy od pierwszego prototypu inteligentnego głośnika, mieliśmy w planach dostarczanie tylko treści audio i informacji z Internetu. W tej chwili dostarczamy największą na świecie otwartą platformę do automatyki domowej, integrującą ponad 1400 komponentów. Odeszliśmy od pierwotnych założeń, ale dzięki temu przygotowaliśmy mocną podstawę do produktu, nad którym dalej pracujemy.

Andrzej jest założycielem całego projektu, Celina zajmuję się obsługą klientów i kontaktami z prasą, a Sebastian odpowiada za tematy sprzętowe.•Fot. AI-Speaker

Jak trudno było nauczyć głośnik komend w języku polskim? Jak wiemy, nie należy on do najłatwiejszych języków.

Tak naprawdę to nie ma znaczenia, jakiego języka używamy – mechanizm dla wszystkich jest ten sam. Najpierw zamieniamy mowę na tekst. W dzisiejszym świecie algorytmy sztucznej inteligencji mają dostarczone nagrania i transkrypcje (nieważne w jakim języku) i próbują różnych metod “zrozumienia” nagrania, aż wynik będzie najbardziej zbliżony do transkrypcji. To oczywiście nie jest coś, co każdy może zrobić w domu i na tę chwilę robią to tylko firmy zajmujące się tym zagadnieniem od lat.

Następnie dochodzi do parsowania tego tekstu, czyli tłumaczenia wypowiedzianej sentencji na intencję zdefiniowaną w systemie. Ten drugi krok jest na tyle prosty, że użytkownik w naszym systemie sam może definiować takie mapowania: sentencja –> intencja –> akcja.

Wasz głośnik działa w domu, a nie chmurze – co to oznacza dla użytkowników?

Chmura to takie magiczne miejsce – gdzieś na świecie są komputery gromadzące dane generowane przez inteligentne głośniki w smart domach, testujące je pod kątem reguł automatyzacji i w razie potrzeby wysyłające polecenia do urządzeń w odpowiednim domu.

W takim rozwiązaniu inteligentny głośnik to tylko mikrofon i głośnik, wszystkie reguły są zdefiniowane na serwerze u producenta rozwiązania. Tak mniej więcej działają obecne systemy automatyki domowej z inteligentnymi głośnikami.

A wasz?

My uważamy, że twój dom powinien być w stanie funkcjonować bez chmury producenta. W naszym urządzeniu reguły automatyzacji zdefiniowane są lokalnie. Chmurę traktujemy jako rozszerzenie inteligentnego domu a nie jego podstawę. Dzięki temu unikamy niezręcznych sytuacji, że coś nie działa, bo nie ma internetu lub dlatego, że producent urządzenia ma problem z usługą.

Czemu dom jest lepszy niż chmura?

Jest tu kilka aspektów, zacznijmy od technicznego. Istnieje wiele powodów, dla których twój dom może utracić połączenie z chmurą. Internet może przestać działać, aktualizacja mogła się nie udać lub nastąpiła awaria serwerów.

Użytkownicy wybierając sterowanie lokalne mają pewność, że będą mogli bez problemów używać swojego urządzenia nawet wtedy, gdy producent zamknie swój serwis w chmurze i zniknie z rynku. Takie sytuacje się dzieją i ludzie wtedy zostają z urządzeniami, których nie da się używać, bo chcą się komunikować tylko przez serwis w chmurze, który już nie istnieje.

Istotna jest też prędkość działania, lokalne przesłanie komunikatu do urządzenia trwa znacznie krócej niż przesyłanie go pomiędzy naszym domem a chmurami producentów urządzeń i producenta asystenta domowego.

Ekipa AI-Speaker kiedy jeszcze ich biuro znajdowało się w garażu, a prototyp głośnika był mniejszą kostką.•Fot. AI-Speaker

Jest też sprawa dla nas istotna – prywatność. Nie chcemy, żeby producent urządzeń wiedział, jak wygląda nasza domowa rutyna, o której wstajemy, jemy śniadanie, ile prądu i wody zużywamy. Wiemy, że z takich danych powstaje nasz profil, który jest cennym towarem sprzedawanym dla reklamodawców.

Ludzie niespecjalnie przejmują się prywatnością. Skąd ten nacisk na bezpieczeństwo?

Chcemy asystenta, który jest naszym domowym asystentem. Takim, do którego mamy zaufanie i wiemy, że działa w naszym interesie. Pomaga nam w codziennych czynnościach nie sprzedając nikomu tych informacji. Szukając informacji chcemy otrzymywać informacje, a nie reklamy.

Przede wszystkim nie chcemy, żeby nasze dane były sprzedawane reklamodawcom, nie chcemy otrzymywać dziesiątek nachalnych reklam jednego produktu, bo akurat o nim wspomnieliśmy czy próbowaliśmy znaleźć poprzez wyszukiwarkę. Nie chcemy być dla kogoś produktem.

Nie chcemy też, żeby dane naszych użytkowników były traktowane jako towar na sprzedaż. Dlatego nie podsłuchujemy i ich nie zbieramy. A jak się nie zbiera takich informacji to nie można ich sprzedawać i nie ma zagrożenia wycieku. Proste!

Asystent Głosowy może być obsługiwany także dzięki aplikacji na smartfon.•Fot. AI-Speaker

Z jakimi urządzeniami można połączyć wasz głośnik?

Platforma automatyki zastosowana w naszym systemie to Home Assistant, który od 5 lat jest tworzony przez tysiące programistów z całego świata. Możliwości są ogromne – obecnie dostępnych jest aż 1465 integracji, a ich liczba z każdym miesiącem wzrasta, z najróżniejszymi urządzeniami firm bardziej lub mniej znanych.

Mamy bramki IoT&audio – to właśnie one są sercem całego projektu i będą docelowo wbudowane w inteligentny głośnik AI-Speaker. Bramką można sterować przy pomocy darmowej aplikacji, która jest do pobrania w sklepie Google Play lub z poziomu przeglądarki internetowej. Do kompletu jest też dedykowany pilot, który posiada wbudowany mikrofon i bardzo ułatwia obsługę urządzenia.

Niedawno wprowadziliśmy też gniazda WiFi, które w ciągu chwili można zintegrować z bramką i od razu sterować komendami w języku polskim. Do działania nie potrzebują chmury i można je łatwo zintegrować z dowolnym systemem sterowania automatyką domową, który rozumie podstawowe protokoły IoT.

Jesteśmy otwarci i nie próbujemy zamknąć użytkownika w jednym ekosystemie. Gniazdka pokrywają 90 proc. zastosowań automatyki domowej. Do tego dochodzi możliwość zintegrowania urządzeń ogromnej liczby producentów. Można więc powiedzieć, że mamy już bardzo kompleksowe rozwiązanie.

Czy udało się wam ustalić ostateczną cenę głośnika i datę premiery?

Prototypy głośnika obecnie są pod okiem, a właściwie pod uchem specjalistów od dźwięku. Zależy nam na tym, żeby nie tylko pięknie wyglądał ale i pięknie grał. Gdy wszystkie testy się zakończą i będziemy mieli zatwierdzone poszczególne komponenty, to wtedy podamy cenę.

Termin sprzedaży zależy od dwóch rzeczy. Pierwsza to zakończenie testów sprzętowych i zatwierdzenie końcowego kształtu głośnika. Druga to wydanie oprogramowania w wersji 1.0. Oczywiście nie zapomnimy o użytkownikach, którzy zakupili u nas wcześniej bramki deweloperskie – planujemy dla nich specjalną ofertę na upgrade do głośnika AI-Speaker.

Zobacz także :