O co chodzi
Programistka zbudowała AI recepcjonistkę głosową dla warsztatu samochodowego swojego brata. Warsztat tracił tysiące dolarów miesięcznie przez nieodebrane telefony — ponad 100 tygodniowo. System o nazwie Axle odbiera połączenia 24/7, odpowiada na pytania o ceny, godziny pracy i dostępne usługi.
Jak to działa
- Klient dzwoni na numer warsztatu
- System zamienia mowę na tekst (speech-to-text)
- Pytanie trafia do bazy wiedzy warsztatu — system wyszukuje odpowiednie informacje (RAG)
- Model AI generuje odpowiedź wyłącznie na podstawie prawdziwych danych warsztatu
- Odpowiedź jest czytana klientowi naturalnym głosem (text-to-speech)
- Gdy system nie zna odpowiedzi — zbiera dane do oddzwonienia
Użyte technologie
- Vapi — platforma do obsługi połączeń głosowych
- Deepgram — zamiana mowy na tekst
- ElevenLabs — zamiana tekstu na mowę (naturalny głos)
- Claude (Anthropic) — model AI generujący odpowiedzi
- MongoDB Atlas Vector Search — wyszukiwanie w bazie wiedzy (wektory)
- Voyage AI — tworzenie embeddingów (wektorów) z dokumentów
- FastAPI (Python) — backend łączący wszystkie elementy
Co się sprawdziło
- Odpowiedzi oparte na prawdziwych danych warsztatu, nie na “wiedzy ogólnej” modelu
- Eskalacja do człowieka gdy AI nie zna odpowiedzi
- Krótkie, naturalne odpowiedzi (2-4 zdania) — dostosowane do rozmowy głosowej
Uwagi użytkowników Hacker News
Dyskusja na HN była dość sceptyczna. Kilka najciekawszych wątków:
Wycena i ceny
Były recepcjonista z warsztatu zauważył, że AI nie ogarnie dynamicznych cen części zamiennych, dostępności materiałów u dostawców i zmiennych kosztów robocizny. Podanie klientowi złej ceny psuje reputację warsztatu — klient zapamięta kwotę od bota i będzie się na nią powoływał.
Niestandardowe naprawy
AI potrafi odpowiadać tylko na tematy, które ma w bazie wiedzy. Przy niestandardowych naprawach (a tych w warsztacie jest sporo) nie oszacuje kosztu ani czasu — bo to wymaga doświadczenia mechanika, nie wyszukiwania w dokumentach.
Dlaczego nie zatrudnić człowieka?
Kilka osób zadało fundamentalne pytanie: skoro warsztat traci tysiące dolarów miesięcznie przez nieodebrane telefony, to recepcjonistka za 3-4 tys. dolarów miesięcznie zwróci się natychmiast. Człowiek lepiej wyczuje kontekst, zbuduje relację z klientem i poradzi sobie z nietypowymi sytuacjami.
Outsourcing vs. budowanie od zera
Wskazano na istniejące usługi outsourcingowych recepcjonistek telefonicznych (150-500$/mies.) — specjalizujące się nawet w branży motoryzacyjnej. Tańsze, prostsze, sprawdzone.
Bot vs. poczta głosowa
Ciekawy punkt: na poczcie głosowej klient nagra wiadomość i czeka na oddzwonienie. Rozmawiając z botem może się sfrustrować i się rozłączyć — strata kontaktu, którą poczta głosowa by uratowała.
Ton głosu to najtrudniejsza część
Sama autorka przyznała, że najtrudniejsze nie było poskładanie technologii, ale dopracowanie naturalnego brzmienia. Krótkie zdania, odpowiedni głos, brak markdowna w odpowiedziach — to zajęło najwięcej czasu.
Pozytywne głosy
Część dyskutujących doceniła dostępność 24/7, brak czekania na linii i możliwość natychmiastowej obsługi prostych pytań (godziny otwarcia, lokalizacja, status naprawy). Jako pierwsza linia kontaktu — zanim klient trafi do człowieka — ma sens.
Intum jako alternatywa
Podobny efekt — AI odpowiadające na pytania klientów na podstawie bazy wiedzy — można uzyskać w Intum bez budowania własnego systemu od zera. Moduł Helpdesk z AI korzysta z bazy wiedzy i modelu Claude do automatycznych odpowiedzi na widgecie czatowym. Zamiast składać kilka zewnętrznych serwisów, wystarczy uzupełnić bazę wiedzy i włączyć AI w ustawieniach helpdesku.