Dobrze Ci radzę: O co chodzi z Voice Commerce?

Table of Contents

Czym jest Voice Commerce i dlaczego powinieneś zainteresować się tym trendem? Większość osób odpowie prawdopodobnie, że to zakupy robione za pomocą wirtualnych asystentów – takich jak na przykład Alexa. To oczywiście prawda, ale jest to bardzo powierzchowne wyjaśnienie. I nie chodzi o to, że takie zakupy można zrealizować także za pomocą Asystenta Google. Voice Commerce to znacznie szersze pojęcie. 

Czy voice commerce jest dla mnie? To pewnie rozwiązanie wyłącznie dla największych graczy na rynku.

To bardzo złożony temat, a Asystent Google i Alexa, są zaledwie wierzchołkiem góry lodowej. Jego całkowite zlekceważenie może skończyć się w niedalekiej przyszłości nieciekawie, dla każdego eCommerce, nawet tego najmniejszego. Zatem, jak przygotować się na Voice Commerce?

Czym jest Voice Commerce?

Voice commerce wykracza poza użycie naszych strun głosowych i wirtualnych asystentów. Najbezpieczniej jest powiedzieć, że to rodzaj zakupów w internecie, w których używamy języka naturalnego, a proces wyboru produktów, które kupujemy, jest podobny do tego, jaki znamy ze sklepów stacjonarnych – dwustronny dialog.

To artykuł z serii “Dobrze Ci radzę”, więc oczywiście wyciągniesz z niego kilka cennych insightów. Szanuję Twój czas, jednak żeby zrozumieć w pełni moje wskazówki najlepiej, abyśmy byli na tej samej stronie. Szybko wyjaśnijmy sobie kilka podstawowych zagadnień, następnie odpowiem jak zastosować tą wiedzę w praktyce.

Radio Rex

Pierwszym urządzeniem sterowanym głosem i rozpowszechnionym komercyjne była zabawka, i co najciekawsze powstała… około 20 lat przed wynalezieniem pierwszych komputerów.

Radio Rex
Radio Rex. Fotografia pochodzi z artykułu Robohub The next era of conversational technology

Radio Rex było budką dla zabawkowego buldoga. Po wypowiedzeniu komendy „REX” pies wyskakiwał z domku. Konstrukcja zabawki była stosunkowo prosta: w budce zainstalowano elektromagnes dostrojony do częstotliwości samogłoski /e/ (500 Hz) zwalniający sprężynę, która wystrzeliwała pieska z budy.

Early adopters

Dzisiaj sprzęt sterowany głosem nikogo już nie zaskakuje. Skoro mówiliśmy o dzieciach – na jednej z konferencji poświęconej chatbotom, prelegent podał przykład wczesnej adaptacji tego typu rozwiązań przez nowe pokolenia. Jego pociecha, od jakiegoś czasu zaczęła mówić do wszystkich urządzeń w domu, na przykład do tostera. Dla dzieciaka stało się to po prostu naturalną formą interakcji z technologią. 

Voice. Czym jest język naturalny?

To język którym posługujemy się codziennie. W odróżnieniu od, na przykład, słów kluczowych, czy haseł, do których użycia przyzwyczailiśmy się w wyszukiwarkach. To “język mówiony”, który zapisujemy w postaci zdań. Tekst, który czytasz, jest zapisany językiem naturalnym. 

Najlepiej będzie zaprezentować różnicę na przykładzie:

  • Język naturalny: “Szukam zimowych butów skórzanych, najlepiej ze skóry naturalnej. Raczej czarnych i eleganckich.“
  • Słowa kluczowe: “Buty czerwone botki skóra”

Rozwój interfejsów

Język naturalny to nasza pierwotna forma komunikacji. Inne formy zaczęły pojawiać się znacznie później. Początkowo w postaci malunków na ścianach, później jako komunikacja pisemna.

W przypadku interfejsów komputerowych, czyli form komunikacji z maszynami, ewolucja przebiegała dokładnie odwrotnie. Zaczęliśmy od interfejsów tekstowych, by następnie wraz z ich rozwojem opracować interfejsy graficzne. Na interfejsy głosowe przyszło nam poczekać nieco dłużej.

Związane jest to bezpośrednio z wzrostem mocy obliczeniowej, jaką dysponują współczesne maszyny, a także tym, co wiemy o języku naturalnym.

Na marginesie: Rozumienie mowy naturalnej, przez maszyny, nawet przy ogromnej mocy obliczeniowej jest sporym wyzwaniem. Wydawać by się mogło, że umiejętność, którą ludzie opanowują w wieku 2 lat, będzie czymś prostym dla komputera, jednak tak nie jest. Gdy przychodzi do zastosowań sztucznej inteligencji, trudne zadania okazują się proste, natomiast te proste stają się bardzo trudne. Podobnie jest z rozpoznawaniem twarzy, orientacją w terenie, czy umiejętnościami motorycznymi, takimi jak chwytanie przedmiotów. Zjawisko to nosi nazwę Paradoksu Moraveca.

Trudność języka

Niełatwo stworzyć inteligentny system, asystenta czy interfejs mowy naturalnej. Zwłaszcza w języku polskim.

  • W porównaniu z językiem angielskim, polskie słowa przybierają wiele form, tak zwanych form fleksyjnych. Wszystko w zależności od kontekstu i ich użycia.
  • Zdanie można rozbić na składowe, które pełnią określone funkcje – rolę w przekazywaniu informacji. W ojczystym języku Alexy i Google – angielskim – znajdziemy 200 takich wariantów. W języku polskim ponad 4000.
  • W języku polskim mamy znacznie mniej restrykcyjne zasady dotyczące szyku w zdaniu (w porównaniu na przykład do niemieckiego). Ta dowolność jeszcze bardziej utrudnia przetwarzanie go przez maszyny.

Sprawa znacznie się komplikuje, gdy chcemy aby taki asystent rozmawiał o produktach (skupiamy się przecież na Voice Commerce).

Proste słowo “koszula” może zatem przybierać wiele form, takich jak koszulami, koszulę, koszuli, i tak dalej. W dodatku znaleźć się może w wielu kontekstach, na wiele różnych sposobów. Nie mówiąc już o jej “parametrach”, czyli właściwościach, takich jak materiał, kolor, czy rozmiar. Handel elektroniczny to rozległa dziedzina, na którą składają się dziesiątki branż. Każda branża związana jest z różnymi produktami opisywanymi przez setki tysięcy cech i właściwości. Te cechy różnią się pomiędzy branżami, a bardzo często, nawet w obrębie tej samej branży. Dodatkowo, te cechy, przyjmują setki różnych wartości.

Głównie dlatego, zakupy, które można zrealizować za pomocą Alexy czy innych voice botów, to powtarzalne zakupy produktów szybkozbywalnych: cukier, kawa, mleko, jajka, sól i tym podobne.

Zapamiętaj

  • Użycie głosu być może jest dla Ciebie czymś, czego nie zrobiłbyś w przestrzeni publicznej, jednak pokolenie ‘Z’ i te, które nadejdą później, nie mają z tym najmniejszych problemów.
  • Pomimo tego, że używanie asystentów polega w większości przypadków na pogawędce, jest on niczym innym jak interfejsem opartym na języku naturalnym.
  • “Voice” to także język pisany – czyli taki, jakim posługujemy się komunikując się ze sobą codziennie. 
  • Przetwarzanie języka jest dla komputerów stosunkowo trudne, jednak wraz z rozwojem tej technologii i wzrostem mocy obliczeniowej komputerów, staje się coraz bardziej przystępne i szerzej stosowane.

Ewolucja sprzedaży

Zakupy głosowe, to jednak nie tylko makaron i mąka. Dosyć znanym przykładem w branży jest tak zwany “Incydent z domkiem dla lalek Alexy”. Na pierwszy rzut oka historia jest całkiem zabawna, po chwili daje do myślenia. O co dokładnie chodzi?

Pewnego dnia w Teksasie sześcioletnia dziewczynka poprosiła Alexę: „Czy możesz pobawić się ze mną w domek dla lalek i kupić mi domek dla lalek?”. Alexa kupiła domek dla lalek wraz z czterema kilogramami ciasteczek. Przyznam, że nie wiem dlaczego Alexa zamówiła ciasteczka, ale możemy założyć, że były one już na liście zakupów (lub według Alexy ciasteczka były częścią zabawy – kto wie). To jednak nie koniec historii.

Incydent był na tyle ciekawy, że trafił do porannych wiadomości w lokalnej telewizji. Prezenterka wypowiedziała na wizji następujące słowa: „Kocham to jak ta dziewczynka mówi Alexa, kup mi domek dla lalek”. Możecie sobie wyobrazić, co stało się potem…

Rzeczywiście, słowa prezenterki “obudziły” mnóstwo Alex, jednak według oświadczenia Amazonu nie doszło do przypadkowych zakupów, ponieważ urządzenia wymagają potwierdzenia zakupu. Dlaczego zatem Alexa nr 1 wykonała polecenie? Tego nie wiemy.

Dobrze Ci radzę! Czyli po co mi ta wiedza?

To co możemy wyciągnąć z tej historii, to dowód na łatwość użytkowania. Voice Commerce jest niejako połączeniem zalet sprzedaży stacjonarnej i e-commerce. Zakupy robimy tak samo, jak kupowalibyśmy ogórki w lokalnym warzywniaku. Jednocześnie nie ogranicza Cię właściwie nic – to wciąż eCommerce.

Dodatkowo zakupy w tej formie otwierają wiele nowych form angażowania użytkowników (“Hej Google, zamów mi bezpłatną próbkę Chanel”, itp.), ale o tym nie będę się dzisiaj rozpisywał. Bez problemu odnajdziecie takie studia przypadku w sieci, są one raczej zarezerwowane dla międzynarodowych korporacji. Na razie…

Trzymaj rękę na pulsie

Wiesz już mniej więcej, w którą stronę zmierza ta technologia. W przypadku nowych trendów zazwyczaj jest tak, że im wcześniej się do nich dostosujesz, tym szybciej będziesz w stanie wykorzystać ich możliwości. Twoja pozycja będzie ugruntowana, a to konkurencja będzie musiała się pod nie dostosować.

Nie wiesz kiedy zawieje wiatr

Wraz z rozwojem interfejsów głosowych, pojawiać się będzie coraz więcej rozwiązań i integracji związanych z Voice Commerce. To co teraz jest ciekawostką, za niedługo może być usługą, od której zależeć będzie Twoja konkurencyjność. Pomyśl z jak wielu technologii, o których kiedyś nawet Ci się nie śniło korzystasz już dziś (w tym z niektórych całkowicie darmowych).   

Optymalizacja pod nowe trendy wyszukiwania

Już teraz Google premiuje optymalizację z użyciem fraz naturalnego języka. Dlatego dobrą praktyką, a wkrótce niemal obowiązkową, będzie pozycjonowanie się na frazy stuprocentowo “naturalne”.

Zwróć także uwagę, że zapytania zadane za pomocą głosu, brzmią nieco inaczej niż te, które użytkownicy wpisaliby na klawiaturze. Szukając odpowiednich, staraj się utrzymać je w konwersacyjnym stylu. 

Pamiętaj jednak, żeby treści, które tworzysz, odpowiadały faktycznie pytaniom, na które się pozycjonujesz. Jeśli takie zadajesz w tekście na blogu, nie mogą być “clickbaitem” – musisz na nie faktycznie odpowiedzieć. Roboty Google są coraz “mądrzejsze” i zorientują się, że próbujesz je wykiwać. 

Wyszukiwarka wewnątrz sklepu

Kolejną z właściwości języka naturalnego, jest to, że zapytania są formułowane często na kilka różnych sposobów, a niejednokrotnie z uwzględnieniem frazy, która nie jest popularna. To tak zwane zapytania “Long-Tail”, mogłeś już o nich słyszeć. W trakcie pozycjonowania, dogłębnie zastanów się nad tematem swojej strony, i postaraj się wyeksploatować cały potencjał, jaki sobą reprezentuje. Weź także pod uwagę ten rodzaj zapytań, w trakcie konfiguracji natywnej wyszukiwarki w swoim sklepie. 

Ostatnia porada

Ostatnia rada, nie jest może odkrywcza, a na pewno nie jest czymś nowym. Jednak w perspektywie użycia urządzeń głosowych, które nie mają wyświetlacza, warto abyś o tym pamiętał. To oczywiście stare, ale jare “ALTY”. Nie będę się o nich szczególnie rozpisywał, bo chyba nietrudno sobie wyobrazić, dlaczego są ważne, gdy Twoja strona będzie “czytana” a nie oglądana.

Słowem podsumowania

Czy w przyszłości jeśli będę miał możliwość kupowania praktycznie wszystkiego za pomocą głosu będę z niej korzystał? Przypuszczam że chętnie, chociaż w przypadku niektórych z nich – na przykład ciuchów, przyda się wsparcie także wyświetlacza. W efekcie poruszam się po sklepie, wyszukuję produkty z użyciem interfejsu głosowego a cały proces przebiega tak, jak gdyby sam sklep był asystentem sprzedaży. 

Ta forma zakupów – Voice Commerce wspierany wyświetlaczem szczególnie mnie interesuje, z prostego powodu – miałem okazję testować takie rozwiązanie. Opracowujemy je w edrone 😉 Trochę więcej mówię na ten temat w podcaście “To jest podcast biznesowy”. Gdy tylko odcinek ujrzy światło dzienne link do niego pojawi się z pewnością w tym tekście!

Dobrze Ci radził:

Marcin Lewek – Brand Manager w edrone.

Wychodzi z założenia, że wszechstronność i holistyczne podejście jest w życiu najważniejsze, dlatego w dzieciństwie chciał zostać paleontologiem, studiował fizykę medyczną, a został specjalistą w obszarze digital marketingu.

W edrone przekłada język AI z technologicznego na ludzki. Zajmuje się designem treści poświęconych zagadnieniom szeroko rozumianej sztucznej inteligencji; w szczególności przetwarzaniu języka naturalnego, voice-commerce, systemom i strategiom rekomendacji sprzedażowych, ale także takich, które pozwalają zrozumieć i oswoić się z AI jako narzędziem obecnym w codzienności – nie tylko tej marketingowej. Po godzinach też tworzy, ale muzykę i scenariusze teatralne.