Авторизация
Регистрация

Напомнить пароль

Тамагочи по новому или свой искусственный интеллект в кармане.Сяочжи, Xiaozhi на основе ESP32, разборка, настройка

  1. Цена: Около 1000 руб
  2. Перейти в магазин
Узнал что есть проект с открытым исходным кодом, в котором можно использовать искуственный интеллект в носимом устройстве. То есть типа алисы в кармане. При этом, в отличие от алисы, маруси и прочих, этот ИИ можно настроить по своему усмотрению — задать ему промт, кем он будет, какая роль — друг, учитель английского, девушка-подружка и прочие. Любые, которые позволит фантазия и которые пропустит ограничения выбранной модели ИИ. На данный момент можно использовать модели языка: Qwen3, DeepSeek V3.1, Doubao Seed V1.6. И я видел Kimi K2, но сейчас ее нет в списке достуапных. Это чатбот, который распознает вашу речь, преобразует ее в текст, модель ИИ обрабатывает его, возвращает текстовый ответ и снова преобразуется в речь, которую умная коробка озвучивает. То есть с ней можно просто говорить, так же как с алисой и аналогами. На данный момент поддерживаются языки — китайский, японский, английский, французский, польский, украинский, русский и другие. Возможно обучение своего ИИ на основе своего (или чужого) голоса, он может распознавать тех, кто говорит, можно задать слово для пробуждения тамагочи или пробуждать его кнопкой и т. д. Можно подключать к умному дому — про это 00svd00 делал обзор.

Я покупал готовое устройство на алике. Стоит около 20$ для РБ (с НДС и доставкой), это примерно 1000 руб для РФ.
Есть такие-же варианты на озоне или wildberries рублей по 800 с доставкой из Китая, но они не доставляются в РБ.
1. www.wildberries.ru/catalog/632188779/detail.aspx
2. https://www.ozon.ru/product/umnaya-kolonka-robot-dlya-xiaozhi-ai-voice-chat-s-esp32-wi-fi-usb-fioletovaya-3216937425
3. https://www.ozon.ru/product/komplekt-zhk-displeya-xiaozhi-ai-voice-chat-esp32-s1-54-devkitc-1-3198459990

Есть много вариантов этого проекта: можно купить только плату, плату с экраном, плату с болшим сенсорным экраном, с сенсорным экраном и камерой и много много других. Есть много варинтов готовых, собранных изделий с корпусами — круглых, квадратных, прямоугольных.
Здесь поисковый запрос на озон с сортировкой по возрастанию цены.
Это один из самых дешевых вариантов, готовых комплектов в корпусе, с экраном, аккумулятором и динамиком. Комплектация — короткий провод для зарядки, наклейка с QR кодом, где есть информация по настройке, и само устройство.
Бумажка напечатана плохо или напечатана давно, еле-еле видна. QR код я прочитал после плясок с бубном. Ссылка ведет на инструкцию по настройке этого устройства:
h5.clewm.net/?url=qr61.cn%2FoZSr5K%2FqjdWnzw&lid=f5hnmmcrslwt50ug4&rlid=f5hnmmcrslwt50ug4
Корпус распечатан на 3D принтере. Вроде корпус неплохой, на передней и задней стенке есть шагрень. Три кнопки сверху, одна сбоку. Внутри корпуса в комплекте был высохший червяк.
Микрофон распаян на плате в левой верхней части. Так же на плате есть микросхема контроля зарядки литиевого аккмулятора со светодиодом. Внизу в разъем подключен аккумулятор, вверху динамик. В верхней левой части красная антенна и разъем для внешней антенны. По центру есть разъем для карты памяти microSD.
На обратной стороне есть только 1,54-дюймовый цветной дисплей.
Плата построена вокруг ESP32-S3 N16R8. Слева от нее красная антенна wi-fi/
Память 25Q128JVSQ на 16 мегабайт.
FMD A30K5m скорее всего два транзистора, выше этой микруки как раз разъем на динамик, ниже скорее всего микросхема аудиоусилителя от MAX с маркировкой +AKM 044
Плоский динамик и аккумулятор отдельно.

На плате была сломана средняя кнопка BOOT и повреждена другая. Видимо кнопку повредили, когда плату запихивали в корпус. Кнопку починил.

Включаю устройство кнопкой сбоку. Болтает по китайски, на экране такая надпись:
(перевод — подключитесь к точке доступа на мобильном телефоне)
Нахожу эту сеть wi-fi с именем Xiaozhi-5EED (у каждого устройства она своя) и ввожу адрес, указанный на экране устройства: 192.168.4.1 Появляется веб страница со списком сетей, которые видит устройство. Страница на китайском, справа можно выбрать английский, но это совсем не очевидно. Нужно выбрать вашу домашнюю сеть wi-fi и ввести ее пароль, чтоб устройство могло подключиться к ней.
Устройство работает только с сетями 2.4ГГц, с 5ГГц не работает.


Тамагочи перезагрузился и подключился к сети wi-fi. При загрузке показывал версию прошивки 1.8.5
Тамагочи пробуждается при нажатии верхней кнопки, две кнопки рядом уменьшают и увеличивают громкость. Кнопка сбоку выключает или перезагружает устройство.
Далее нужно зайти на сайт проекта, зарегистрироваться и добавить это устройство в аккаунт. Для этого нужно выведать у тамагочи 6-значный код подключения.
С компьютера захожу на xiaozhi.me/console/agents
Прохожу там регистрацию. Нужно выбрать страну, на номер телефона придет уведомление.
Есть Россия, Казахстан, Украина, Беларусь и много других.
После регистрации по умолчанию вроде уже был один агент, но можно без проблем добавить или удалить еще одного агента. Добавление агента скрывается под стрелкой слева вверху.
На фото ниже слева агент с именем Тамагочи, модель ИИ — DeepSeek, выбран женский голос озвучки.
Справа агент с именем test, модель ИИ — Qwen, голос озвучки Stella.
Для настройки агента нужно нажать на Gonfigure Role. Картинка ниже переведена гугл переводчиком с китайского. Там половина на китайском, половина на английском.
В верхней части есть 5 готовых ролей. Например, если выбрать роль «репетитор английского языка», то в окне «введение в роль» появится текст на китайском. Гугл переводчик не перевел текст в окне, поэтому привожу перевод тут:
Меня зовут {{assistant_name}} (Лили). Я говорю на китайском и английском языках со стандартным произношением.
Если у вас нет английского имени, я вам его дам.
Я свободно говорю на американском английском и помогу вам практиковать разговорный английский.
Я буду использовать простую английскую лексику и грамматику, чтобы вам было легче учиться.
Я буду отвечать вам на смеси китайского и английского, но могу отвечать полностью на английском, если вам удобнее.
Я буду отвечать кратко и с минимальными затратами, так как хочу научить своих учеников больше говорить и практиковаться.
Я откажусь отвечать на вопросы, не связанные с изучением английского языка.
Ниже можно выбрать модель языка и прочие параметры.
То есть по сути эти 5 ролей это просто несколько готовых промптов для ИИ, можно и нужно их корректировать и писать свои. Например, в промпте выше я бы исправил «Я буду отвечать вам на смеси китайского и английского» на «Я буду отвечать вам на смеси русского и английского» — зачем мне китайский? То есть можно гибко конфигурировать агента. Например, если агент создается для устройства, которым будет пользоваться ребенок, то можно обозначить в нем список тем, на которые ИИ не даст ответа.
Если нажать кнопку «Оптимизация ИИ» справа от окна промпта, то текст увеличивается раза в три, обрастает подробностями, которые тоже можно редактировать под свои нужды.
В этом же окне есть выбор языка диалога и озвучка этого языка. Озвучку можно тут же прослушать. Языки есть китайский, английский, французский, испанский, русский, корейский, итальянский, португальский, немецкий, польский и прочие. Русский есть, белорусского, казахского, украинского пока нет.
Для английского есть 13 вариантов озвучки, для русского 5 вариантов. Все можно прослушать.

Далее нужно связать этого агента с моим устройством. Для этого на странице агентов нужно нажать «Add device» и страница спрашивает 6-значный код. Этот код нужно узнать у устройства.
В инструкции, которую я открыл по QR коду, написано, что код должен быть на экране устройства при его загрузке или же код можно получить, сказав ему фразу «Привет, Xiaozhi».
При загрузке устройства код не появляется, фразу «Привет, Xiaozhi» я говорил сам, потом скармливал ее гугл переводчику и он ее говорил на анлийском Hello Xiaozhi, на китайском 你好小智 и все равно не удалось выпытать код их этого шпиона. Точне шпионки, потому что голос озвучки стоит женский.
У него есть разные варианты анимации лица в зависимости от состояния и текста, который он проговаривает.

Я написал продавцу вопрос, как можно узнать код устройства и пока стал разбалтывать этого тамагочи. Я попросил его говорить по английски и она почти согласилась. То есть иногда она переходила на китайский, но после моей просьбы, снова говорила по английски. Простыми командами типа «Volume up» «Maximum volume» «Daytime screen», «night time screen»можно управлять звуком, так же можно управлять яркостью, включать ночную и дневную тему и так далее. Общение с голосовыми командами можно услышать и увидеть на видео ниже.


На видео ниже я попросил ее побыть преподавателем английского языка и удалось с ней немного поговорить. Фрагмент разговора можно увидеть на видео ниже.


В этой коробке аккумулятор всего на 500мАч, половина заряда ушла за время тестрирования. Я решил зарядить его до конца чтоб проверить время автономной работы. Поставил на заряд на ночь, утром аккумулятор был полностью заряжен, но тамагочи не включался.
Снова разоборал его, аккумулятор 4.17В, но на контрольной точке 3.3 вольта на плате напряжение равно нолю. Подал на эту точку 3.3 вольта с ЛБП с ограничением тока 100мА — напряжение на ЛБП сильно просело. Включил тепловизор и стал поднимать ток — увидел, что греется сам ESP32.
То есть что-то пошло не так, проц сгорел и просадил напряжение питания 3.3 в ноль.

В общем интересное устройство. Позволяет вести диалоги на разных языках, отвечает быстро и остроумно. Проблема с 6-значным кодом на экране может быть решена прошивкой устройства с ноля, скорее всего в других версиях прошивки этот код показывается на экране при запуске. Тем более, что у меня была версия 1.8.5, а уже есть 2 версия прошивки.
Можно прикрутить к нему управление умным домом и просто давать команды на исполняющие устройства, можно создать собственный сервер с ИИ и рабоать с ним, можно прошить эту плату ESP32 прошивкой с других проектов, можно купить другую плату с большим экраном, поставить больший аккумлуятор, подключить камеру и многое другое. На основе этой платы и с этим проектом есть корпуса в виде часов на руку, в виде медальона на шею, в виде разных фигурок, вариантов море.
Возможно перепаяю сам процессор ESP32 на этой плате и прошью с ноля на xiaozhi.
В настройках агента можно добавить распознавание говорящего (то есть может узнавать хозяина и его друзей), можно задать фразу для пробуждения, чтоб не нажимать кнопку, можно сделать клон голоса — чтоб тамагочи говорил вашим голосом или голосом знакомого или голосом знаменитости.
Многие возможности можно попробовать и без устройства, зарегистрировавшишь на сайте xiaozhi.me
Страница проекта с описанием и прошивками на гитхаб: github.com/78/xiaozhi-esp32
Открыл спор по дефекту товара — не работает, вернул большую часть денег.
Я заказал другие платы для реализации этого проекта, продолжение следует…
Планирую купить +3 Добавить в избранное
+19 +21
свернутьразвернуть
Комментарии (40)
RSS
+
avatar
0
Комментарий ожидает проверки администрацией сайта. Подробнее...
+
avatar
0
2225 как-бы, не 1000.
+
avatar
+2
Я поставил ссылку на продавца, у которого я покупал.
Их полно по похожей цене
https://aliexpress.ru/item/1005010134757160.html
https://aliexpress.ru/item/1005009898855179.html
При этом на озоне и WB дешевле.
+
avatar
+1
Не доставляется в Мск и М.область…
но на WB есть, и стоит тысячу с чем-то.
+
avatar
+4
Весь ИИ крутится на сайте (где вы зарегались). Тамагочи просто принимает текст и озвучивает его (технология TTS aka text-to-speach). На отправку, просто гонит цифру (скорее всего в mp3) на сервер. ИИ на сервере обрабатывает и отдаёт вам текст ответа. По сути неумная балайка аля internet radio или радиоточки. Без доступа в интернет естественно превращается в тыкву.

Вот открытая библиотека для постройки своего тамогочи и радио- github.com/schreibfaul1/ESP32-audioI2S Умеет читать текст и принимать потоки почти во всех популярных форматах (mp3, ogg, flac).
+
avatar
+2
Тамагочи просто принимает текст и озвучивает его (технология TTS aka text-to-speach).
В обзоре:
Это чатбот, который распознает вашу речь, преобразует ее в текст, модель ИИ обрабатывает его, возвращает текстовый ответ и снова преобразуется в речь, которую умная коробка озвучивает.
Да, все так, это готовый голосовой чат с ИИ в виде deepseek или Qwen. У того, что ИИ в облаке, есть свои плюсы и минусы. Я думаю, что не получится запустить ИИ с большим быстродействием и большой базой в такой маленькой коробке. При этом можно все просто настроить за полчаса.
Но при этом есть зависимость от провайдера ИИ и наличия интернета
+
avatar
+4
Я просто как прочитал в названии
свой искусственный интеллект в кармане
так из меня аж кирпичи посыпались. Дальше не смотрел.

Зачем желитите и кликбейтите товарищ? Не хорошо.
+
avatar
+2
  • IWRY
  • 01 января 2026, 18:30
Какой ИИ на таком железе?
+
avatar
+1
ИИ не в железе, в качестве ИИ используется deepseek или Qwen3 или Doubao на выбор. Естественно, что ИИ крутится на их сервере.
В алисе, марусе и прочих коробках ИИ тоже сидит не в самой коробке.
+
avatar
0
Вроде как на малине можно запустить свой автономный (но это не точно).
+
avatar
0
  • IWRY
  • 01 января 2026, 19:22
на малине можно запустить свой автономный
Такой?
www.reddit.com/r/raspberry_pi/comments/1kqp8ke/i_got_an_ai_model_llm_running_on_my_pi_and_made/?tl=ru
)))
+
avatar
0
  • IWRY
  • 01 января 2026, 18:36
Естественно, что ИИ крутится на их сервере.
И чем тогда такая коробочка лучше приложения на смарте?
+
avatar
+1
Ничем… и в интернет радио не переделать, тк звук моно с качеством как из консервной банки.
+
avatar
0
Какое приложение в телефоне может делать похожее?
Алиса в телефоне отдаленно похожа, но ее нельзя настроить под себя.
+
avatar
+1
Угу, да еще в кармане… главное от wifi далеко не отходить, чтобы карман не треснул.
+
avatar
0
  • IWRY
  • 01 января 2026, 18:44
Какое приложение в телефоне может делать похожее?
Написанное теми, на чьём сервере крутится ИИ, разумеется.
Очевидно же, что сделать только софт сильно проще и дешевле, чем отдельную железку и софт под неё.
+
avatar
+2
Так все же какое приложение?
Вы пишете «И чем тогда такая коробочка лучше приложения на смарте?»
Что за приложение то?
+
avatar
+2
  • IWRY
  • 01 января 2026, 18:55
Что за приложение то?
Не занимался.
Есть простая логика — если такая убогая железка может, то смарт точно справится, вопрос лишь в реализации.
Сын к этим делам ближе, спрошу.
+
avatar
0
Очевидно же, что сделать только софт сильно проще и дешевле, чем отдельную железку и софт под неё.
Если так сделать, то не впарить эту коробку гикам, по оверпрайс.
+
avatar
+1
Ну если для вас 1000 за готовое устройство это оверпрайс, то сочувствую.
Есть варианты платы за 500 руб без дисплея. Добавить плоский литиевый аккумлятор, положить в спичечный коробок и будет почти то же самое, но в два раза дешевле.
https://www.ozon.ru/product/plata-razrabotki-mini-esp32-s3-n16r8-modul-golosovogo-dialoga-xiaozhi-ai-tip-c-bez-displeya-2967928640

https://www.ozon.ru/product/xiaozhi-ai-01-komplekt-intellektualnogo-golosovogo-dialoga-ai-3282970903
+
avatar
-2
готовое устройство
с распечатанный корпусом на 3д притере не может быть готовым устройством. Прототипом да, готовым нет.
+
avatar
+2
какие ваши доказательства?
+
avatar
0
ну на рендере картинка лучше) Мне тоже не очень нравится распечатанное из принтера с большим шагом. Я обычно когда что-то такое получаю, еще наждачкой с мелкой гритностью и ацетоном обрабатываю
+
avatar
+1
  • IWRY
  • 01 января 2026, 19:08
Если так сделать, то не впарить
Софт тоже можно продавать ващет)
+
avatar
-1
Да кто его купит. Щас бесплатно столько…
+
avatar
+1
  • sunpp
  • 01 января 2026, 19:03
но ее нельзя настроить под себя
да ну? А тут сильно Вы настроите? У него даже проц сгорел во время зарядки аккума — это хороший показатель
+
avatar
+1
какое приложение в телефоне может делать похожее?
браузер + chatgpt (или что вам интереснее)? :)
+
avatar
0
Вы можете настроить ИИ в браузере под себя?
Или браузер может отправлять промт в chatgpt или deepseek чтоб он был учителем англиского? Или читал сказки?
Есть готовая связка STT -> ИИ -> TTS? Чтоб при этом ИИ настраивался под себя.
+
avatar
+1
вы можете настроить ИИ в браузере под себя?
расшифруйте, что вы подразумеваете под 'настроить под себя'? И как вы настраиваете 'под себя' эту коробку
или браузер может отправлять промт в chatgpt или deepseek чтоб он был учителем англиского?
он может ровно то же самое, что и эта коробка. Ибо она отправляет запрос в те же модели. Пример — попросил чатжпт составить подборный план обучения скриптам. Когда согласовали общий план, он потом подробно по каждому пункту расписал информацию. Голосовой режим в чатжпт есть. Голос понимает
+
avatar
0
асшифруйте, что вы подразумеваете под 'настроить под себя'?
Обычно это особый красноглазый йумар про «кожаных мешков».
+
avatar
0
расшифруйте, что вы подразумеваете под 'настроить под себя'? И как вы настраиваете 'под себя' эту коробку
В обзоре же это описано.
Выбор языка диалога и выбор голоса озвучки, настройка скорости речи, настройка роли агента через промт, добавление голоса пользователя, добавление своего голоса для озвучки, выбор ИИ для диалога.
Не все получилось потестировать, через недельку придут новые запчасти, продолжу изучение.
Пример — попросил чатжпт составить подборный план обучения скриптам. Когда согласовали общий план, он потом подробно по каждому пункту расписал информацию. Голосовой режим в чатжпт есть. Голос понимает
У нас он работае только через слово из трех букв, но попробую, может тоже пойдет.
+
avatar
0
Китайцы там каждый день новые версии выкатывают — как в топике, но с миниджеком и активацией по голосу, которую можно перебивать, в форме робота-собачки, валли с глазками вместо смайлика, с камерами, которые оценивают обстановку и твои эмоции, в виде ретро-радио, с встроенной 4г симкой, оплаченной на год и кучу других вариантов. Вполне возможно скоро русский понимать из коробки начнут) эта версия чуть ли не одна из первых
+
avatar
0
Да их море. Для начала я выбрал самую простую, еще заказал несколько вариантов для работы с этим же проектом Сяочжи.
Активация по голосу вроде работает в версии прошивки от 2.0
Камеру можно цеплять и к этой коробке.
+
avatar
0
с камерами, которые оценивают обстановку и твои эмоции, в виде ретро-радио
та ну нафиг шпиона от китайцев себе ставить, что бы он на сервера все передавал
+
avatar
0
ну да, алиса гораздо лучше в этом плане
у нее же сервера ближе
+
avatar
0
алиса гораздо лучше в этом плане
у меня ее нет)
+
avatar
+1
Мне пока хватает моего естественного интеллекта. А по дому бегают три хвостатых тамагочи с разными скинами, но жрать и гадить они умеют гораздо лучше, чем компьютерные ;)
+
avatar
0
внутри корпуса в комплекте был высохший червяк
вы, надеюсь, его не выкинули? Это автономная ИИ модель, записанная на молекулярном уровне
+
avatar
+2
  • IWRY
  • 01 января 2026, 19:10
вы, надеюсь, его не выкинули?
Видимо, выкинул, потому и проц сдох))
+
avatar
0
скорее всего. Червяк снижал потребление процессора и брал на себя часть функций
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.