XiaoZhi AI Voice Chat Robot Speaker Box
- Цена: 2 674 ₽
- Перейти в магазин
Некоторое время назад я с удивлением обнаружил, что китайцы вовсю торгуют заготовками для умных колонок\голосовых помощников, причём в куче разных вариантов и оформлений(но +- на одной аппаратной базе). Выбрав наиболее приличный(чисто визуально) вариант, я незамедлительно его заказал. Подробности под катом.
Вопрос самодельных безумных колонок в связке с HA длится достаточно долго. По сути, до недавнего времени вариантов было только два — либо M5 Stack Atom Echo, либо кастомный сумрачный DIY из рассыпухи. Насчет второго не в курсе, но Atom Echo у меня есть и он откровенно никакой, крайне тугой микрофон, крайне тихий динамик, не слышит нормально даже с полуметра и с того же полуметра необходимо прислушиваться, чтобы понять чего он там лопочет.
Затем — внезапно — разрабы HA выпустили Voice Assistant Preview Edition(я тут некоторое время назад публиковал обзор). Он прекрасен как рассвет, у него отличный дизайн и встроенный шумодав, он слышит меня даже из другой комнаты… Короче, он был на две головы выше всех вариантов и был бы идеален, если бы не цена.
Также параллельно SeeedStudio выпустили несколько девкитов с той же микрофонной сборкой и шумодавом, что и в Voice Assistant PE. В том числе самый ИМХО интересный с точки зрения колхозинга ReSpeaker Lite.
И да, я даже запилил на его базе колонку)
Впрочем, выигрыш по цене в сравнении с Voice Assistant PE вышел не слишком значительный, а девайс получился в чём-то лучше, но в чём-то и хуже. Потому обзор пилить я не стал(может, когда-нибудь потом).
В любом случае, теперь в продаже есть целая россыпь железок, довольно таки неплохих и куда как более дешёвых.
Конкретно купленный мной вариант называется Waveshare ESP32-S3-Touch-LCD-1.85C
Приходит в обычной картониевой коробке и антистатическом пакете
Кроме самой колонки в коробке плавают пара коннекторов с проводками и — опять же внезапно — аккумулятор отдельно.
Аккумулятор на 1000mAh и почему он не внутри колонки — сие тайна великая есть. Может, какие-то приколы с таможней, может есть варианты комплектации без аккумулятора. Не знаю.
При встряхивании колонки выяснилось, что внутри что-то активно болтается. Снимаем решётку на дне(сколупывается ногтем)
И выясняем что динамик тоже решил погулять(видимо, без аккума внутри одному скучно). Раскручиваем три винта.
И понимаем, что динамик должен был держаться на трёх каплях термосоплей, а верхняя часть колонки — это вполне себе отдельный модуль, который можно использовать самостоятельно. Даже распиновка красиво оформлена и наклеена — ребята явно вдохновлялись продукцией M5 Stack.
Откручиваем стойки
И встречаем внутри плату на базе МК ESP32-S3.
Выполнено аккуратно, UART и SPI выведены в разъёмы, есть слот под карту памяти(с аутентичным китайским отпечатком). Становится понятно, что боковые кнопки — это стандартные для всех девкитов BOOT и RST. Тумблер включения кстати просто разрывает линию от аккумулятора, при подключении к USB железка включается вне зависимости от его положения.
Из интересного — зоркий глаз может заметить некий разъём RTC — он нужен для подключения батарейки для питания RTC чипа (PCF85063). Вероятно, в каких-то задачах может пригодиться.
Также зоркий глаз мог заметить некий неподписанный потенциометр — он служит для подстройки громкости. Лично я крутить его не стал — оно в целом и так было настроено +- адекватно под комплектный динамик.
Для желающих больше подробностей — микрухи крупным планом и страничка производителя с описанием
Ну и раз уж мы дошли до этой точки — скручиваем короткие стойки и смотрим на огромное блестящее ничего с другой стороны платы
Тут живут только экранный шлейф и микрофон. Расположение микрофона ИМХО достаточно неудачное — слуховое окно у него выходит на первую сторону платы(см. прошлые фото, там дырочка подписанная), а значит он слушает в первую очередь внутреннее пространство колонки. Резонатор. Там громко. Фиговый листочек в виде перегородки, которую удерживали длинные стойки, не спасает. К этому вопросу чуть позже ещё вернёмся. Также в очередной раз зоркий глаз мог заметить, что микрофон только один. Шумодава нет и не предвидится.
Подключаем аккумулятор, собираем всё до кучи. Крепить динамик дополнительно не потребовалось, его плотно подпёр аккум. Зачем нужно было его подключать и клеить на термосопли, не подключая при этом аккумулятор — тоже загадка. Вид снизу на колонку в сборе.
Подаём питание, загружается китайская прошивка, которая наверное что-то умеет делать
Выяснять не стал, откровенно неинтересно. Мне нужен был голосовой помощник для HomeAssistant — и к счастью есть репозиторий под EspHome, где всё уже сделано за нас(ну почти)
github.com/RealDeco/xiaozhi-esphome/tree/main?tab=readme-ov-file
Там же есть список ссылок на другие подобные китайские недоколонки, которые этот проект поддерживает. Их прям много, на любой вкус
Для модуля по ссылке в шапке нужен этот ямл
github.com/RealDeco/xiaozhi-esphome/blob/main/devices/Waveshare/ESP32-S3-Touch-LCD-1.85C.yaml
Судя по всему, есть ещё вторая ревизия платы, отличается только экраном. Как их отличить не знаю. но если залить прошивку не для той — будет что-то такое
Также в ямл нужно будет внести несколько изменений. Во первых, если ваш экземпляр ESPHome работает в докере — надо прибить гвоздями правильную таймзону(т.е. в блоке time добавить timezone: «Europe/Moscow»(для Москвы, очевидно)
Также для нормального отображения кириллических символов нужно будет поменять шрифты
font_glyphsets: «GF_Cyrillic_Core»
font_family: Roboto
Также в allowed_characters можно повыпиливать всякие левые символы из других языков чтоб в логах при загрузке не сыпало ворнингами, но это не обязательно.
В начале ямла также есть несколько переменных, позволяющих настроить визуальное оформление
Посмотреть, что именно ставим можно в репозитории проекта в папке Images, я себе воткнул рисованую анимушную девочку(ибо почему нет?)
Прошиваем, запускаем, подключаем к HomeAssistant.
Процесс подключения колонки и настройки голосового ассистента уже был освещён в прошлом обзоре, второй раз тоже самое писать не вижу смысла ибо ничего не поменялось. По прежнему самый стабильный и производительный вариант — это VOSK с ограничением словаря для распознавания речи и piper для генерации.
Получаем такую вот приколюху

Весь стандартный функционал при этом работает, можно попросить включить таймер
Экран тут сенсорный, выступает в роли кнопки(аналогично той, что была на корпусе Voice PE), но почему-то одиночные тапы обрабатываются не всегда уверенно. На свайпы реагирует лучше
Можно спросить про погоду
Да, знаю, голос немного подкачал и плохо сочетается с анимушной девочкой, но единственный женский голос, доступный в Piper откровенно ну такой
Для воспроизведения музыки колонка подходит не очень хорошо, динамик откровенно не вывозит высокие, собственно так же, как и VoicePE. Плюс громокость тоже не бог весть. Можно попробовать покрутить подстроечный потенциометр, но на голосовые команды её хватает, а музыка тут точно мимо.
Впрочем, если запускать поток с интернет-радио с вусмерть пережатым динамическим диапазоном, то играет приемлемо
На видео я произношу фразу-активатор и прошу колонку включить музыку. Фраза «Включи музыку» у меня забинжена на автоматизацию, которая запускает воспроизведение потока с интернет-радио на девайсе, который автоматизацию триггернул. Звучит уже получше
Но тут вылезает главный косяк — в момент воспроизведения колонка полностью нафиг глохнет, можно громко говорить фразу-активатор прямо в упор — ей по боку. Неудачное расположение микрофона плюс отсутствие шумодава.
В обычных же условиях чувствительность микрофона достаточно неплохая, с примерно трёх метров колонка меня слышит и реагирует. Если сравнивать лоб-в-лоб с самопалом на Respeaker Satellite, то у последнего чувствительность несколько выше, но не прям критично. Voice PE впрочем всё ещё вне конкуренции, из соседней комнаты слышит только он.
Плавно переходим к выводам.
На мой вкус, по качеству работы в роли голосового помощника все ощупанные мною девайсы расположились в таком порядке:
1. HomeAssistant Voice PE (S тир, эталон, лучшее что сейчас могут купить деньги)
2. Respeaker Lite от Seeed Studio(но это голая плата и колонку из неё ещё нужно сделать. Не факт что выйдет удачно)
3. Обозревамый китаец
4. M5 Echo Atom (F тир, не надо это брать, проще принести из леса длинную палку и тыкать ей в выключатель, чем добиться от него внятной работы)
Но при этом данный китаец приезжает в виде почти готового устройства, с экранчиком, красивенький, в куче разных оформлений. И стоит вполне разумных денег. По сумме свойств думаю что на текущий момент он — оптимальный вариант по соотношению цена\качество.
Из недостатков — не самый удачный микрофон и не самый громкий динамик, но и то и другое на голову лучше чем у M5 Echo Atom. Из достоинств — всё остальное, прекрасный полуфабрикат для домашней автоматизации.
Всем спасибо за внимание!
Вопрос самодельных безумных колонок в связке с HA длится достаточно долго. По сути, до недавнего времени вариантов было только два — либо M5 Stack Atom Echo, либо кастомный сумрачный DIY из рассыпухи. Насчет второго не в курсе, но Atom Echo у меня есть и он откровенно никакой, крайне тугой микрофон, крайне тихий динамик, не слышит нормально даже с полуметра и с того же полуметра необходимо прислушиваться, чтобы понять чего он там лопочет.
Затем — внезапно — разрабы HA выпустили Voice Assistant Preview Edition(я тут некоторое время назад публиковал обзор). Он прекрасен как рассвет, у него отличный дизайн и встроенный шумодав, он слышит меня даже из другой комнаты… Короче, он был на две головы выше всех вариантов и был бы идеален, если бы не цена.
Также параллельно SeeedStudio выпустили несколько девкитов с той же микрофонной сборкой и шумодавом, что и в Voice Assistant PE. В том числе самый ИМХО интересный с точки зрения колхозинга ReSpeaker Lite.
И да, я даже запилил на его базе колонку)
Впрочем, выигрыш по цене в сравнении с Voice Assistant PE вышел не слишком значительный, а девайс получился в чём-то лучше, но в чём-то и хуже. Потому обзор пилить я не стал(может, когда-нибудь потом).В любом случае, теперь в продаже есть целая россыпь железок, довольно таки неплохих и куда как более дешёвых.
Конкретно купленный мной вариант называется Waveshare ESP32-S3-Touch-LCD-1.85C
Приходит в обычной картониевой коробке и антистатическом пакете
Кроме самой колонки в коробке плавают пара коннекторов с проводками и — опять же внезапно — аккумулятор отдельно.
Аккумулятор на 1000mAh и почему он не внутри колонки — сие тайна великая есть. Может, какие-то приколы с таможней, может есть варианты комплектации без аккумулятора. Не знаю.При встряхивании колонки выяснилось, что внутри что-то активно болтается. Снимаем решётку на дне(сколупывается ногтем)
И выясняем что динамик тоже решил погулять(видимо, без аккума внутри одному скучно). Раскручиваем три винта.
И понимаем, что динамик должен был держаться на трёх каплях термосоплей, а верхняя часть колонки — это вполне себе отдельный модуль, который можно использовать самостоятельно. Даже распиновка красиво оформлена и наклеена — ребята явно вдохновлялись продукцией M5 Stack.Откручиваем стойки
И встречаем внутри плату на базе МК ESP32-S3.
Выполнено аккуратно, UART и SPI выведены в разъёмы, есть слот под карту памяти(с аутентичным китайским отпечатком). Становится понятно, что боковые кнопки — это стандартные для всех девкитов BOOT и RST. Тумблер включения кстати просто разрывает линию от аккумулятора, при подключении к USB железка включается вне зависимости от его положения.Из интересного — зоркий глаз может заметить некий разъём RTC — он нужен для подключения батарейки для питания RTC чипа (PCF85063). Вероятно, в каких-то задачах может пригодиться.
Также зоркий глаз мог заметить некий неподписанный потенциометр — он служит для подстройки громкости. Лично я крутить его не стал — оно в целом и так было настроено +- адекватно под комплектный динамик.
Для желающих больше подробностей — микрухи крупным планом и страничка производителя с описанием
Ну и раз уж мы дошли до этой точки — скручиваем короткие стойки и смотрим на огромное блестящее ничего с другой стороны платы
Тут живут только экранный шлейф и микрофон. Расположение микрофона ИМХО достаточно неудачное — слуховое окно у него выходит на первую сторону платы(см. прошлые фото, там дырочка подписанная), а значит он слушает в первую очередь внутреннее пространство колонки. Резонатор. Там громко. Фиговый листочек в виде перегородки, которую удерживали длинные стойки, не спасает. К этому вопросу чуть позже ещё вернёмся. Также в очередной раз зоркий глаз мог заметить, что микрофон только один. Шумодава нет и не предвидится.Подключаем аккумулятор, собираем всё до кучи. Крепить динамик дополнительно не потребовалось, его плотно подпёр аккум. Зачем нужно было его подключать и клеить на термосопли, не подключая при этом аккумулятор — тоже загадка. Вид снизу на колонку в сборе.
Подаём питание, загружается китайская прошивка, которая наверное что-то умеет делать
Выяснять не стал, откровенно неинтересно. Мне нужен был голосовой помощник для HomeAssistant — и к счастью есть репозиторий под EspHome, где всё уже сделано за нас(ну почти)github.com/RealDeco/xiaozhi-esphome/tree/main?tab=readme-ov-file
Там же есть список ссылок на другие подобные китайские недоколонки, которые этот проект поддерживает. Их прям много, на любой вкус
Для модуля по ссылке в шапке нужен этот ямлgithub.com/RealDeco/xiaozhi-esphome/blob/main/devices/Waveshare/ESP32-S3-Touch-LCD-1.85C.yaml
Судя по всему, есть ещё вторая ревизия платы, отличается только экраном. Как их отличить не знаю. но если залить прошивку не для той — будет что-то такое
Также в ямл нужно будет внести несколько изменений. Во первых, если ваш экземпляр ESPHome работает в докере — надо прибить гвоздями правильную таймзону(т.е. в блоке time добавить timezone: «Europe/Moscow»(для Москвы, очевидно)
Также для нормального отображения кириллических символов нужно будет поменять шрифтыfont_glyphsets: «GF_Cyrillic_Core»
font_family: Roboto
Также в allowed_characters можно повыпиливать всякие левые символы из других языков чтоб в логах при загрузке не сыпало ворнингами, но это не обязательно.В начале ямла также есть несколько переменных, позволяющих настроить визуальное оформление
Посмотреть, что именно ставим можно в репозитории проекта в папке Images, я себе воткнул рисованую анимушную девочку(ибо почему нет?)Прошиваем, запускаем, подключаем к HomeAssistant.
Процесс подключения колонки и настройки голосового ассистента уже был освещён в прошлом обзоре, второй раз тоже самое писать не вижу смысла ибо ничего не поменялось. По прежнему самый стабильный и производительный вариант — это VOSK с ограничением словаря для распознавания речи и piper для генерации.
Получаем такую вот приколюху

Для тех, у кого почему-то плохо работает ютьюб
На видео я произношу фразу-активатор, после чего прошу включить свет в мастерской. Колонка немножко думает и включает. Девочка на экране при этом хмурит личико, меняет позы и выдаёт запрос и ответ в диалоговых пузырях на чистом русском языке
Весь стандартный функционал при этом работает, можно попросить включить таймер
Для тех, у кого почему-то плохо работает ютьюб
На видео я произношу фразу-активатор, после чего прошу включить на 15 секунд. Появляется прогресс-бар и обратный отсчёт, по окончании включается звук будильника, который я останавливаю жамканьем экрана
Экран тут сенсорный, выступает в роли кнопки(аналогично той, что была на корпусе Voice PE), но почему-то одиночные тапы обрабатываются не всегда уверенно. На свайпы реагирует лучше
Можно спросить про погоду
Для тех, у кого почему-то плохо работает ютьюб
На видео я произношу фразу-активатор, после чего спрашиваю колонку «что там на улице?». Эта фраза у меня замаплена на запрос «погода», в результате колонка озвучивает, что же там таки на улице
Да, знаю, голос немного подкачал и плохо сочетается с анимушной девочкой, но единственный женский голос, доступный в Piper откровенно ну такой
Для тех, у кого почему-то плохо работает ютьюб
Происходит то же самое, что и на прошлом видео, только вместо голоса ruslan включен голос irina
Для воспроизведения музыки колонка подходит не очень хорошо, динамик откровенно не вывозит высокие, собственно так же, как и VoicePE. Плюс громокость тоже не бог весть. Можно попробовать покрутить подстроечный потенциометр, но на голосовые команды её хватает, а музыка тут точно мимо.
Для тех, у кого почему-то плохо работает ютьюб
На видео я включаю воспроизведение лунной сонаты на колонке. Играет паршивенько
Впрочем, если запускать поток с интернет-радио с вусмерть пережатым динамическим диапазоном, то играет приемлемо
В этом месте должно было быть видео, но в отличие от меня ютьюб сумел угадать песню с трёх нот и забанил ролик. За пределами РФ может воспроизводиться, но это не точно
На видео я произношу фразу-активатор и прошу колонку включить музыку. Фраза «Включи музыку» у меня забинжена на автоматизацию, которая запускает воспроизведение потока с интернет-радио на девайсе, который автоматизацию триггернул. Звучит уже получше
Но тут вылезает главный косяк — в момент воспроизведения колонка полностью нафиг глохнет, можно громко говорить фразу-активатор прямо в упор — ей по боку. Неудачное расположение микрофона плюс отсутствие шумодава.
В обычных же условиях чувствительность микрофона достаточно неплохая, с примерно трёх метров колонка меня слышит и реагирует. Если сравнивать лоб-в-лоб с самопалом на Respeaker Satellite, то у последнего чувствительность несколько выше, но не прям критично. Voice PE впрочем всё ещё вне конкуренции, из соседней комнаты слышит только он.
Для тех, у кого почему-то плохо работает ютьюб
На видео я отошёл от колонки на 3 метра и показываю, что она прекрасно меня слышит. На фоне происходит творческий бардак в мастерской, за что прошу прощения
Плавно переходим к выводам.
На мой вкус, по качеству работы в роли голосового помощника все ощупанные мною девайсы расположились в таком порядке:
1. HomeAssistant Voice PE (S тир, эталон, лучшее что сейчас могут купить деньги)
2. Respeaker Lite от Seeed Studio(но это голая плата и колонку из неё ещё нужно сделать. Не факт что выйдет удачно)
3. Обозревамый китаец
4. M5 Echo Atom (F тир, не надо это брать, проще принести из леса длинную палку и тыкать ей в выключатель, чем добиться от него внятной работы)
Но при этом данный китаец приезжает в виде почти готового устройства, с экранчиком, красивенький, в куче разных оформлений. И стоит вполне разумных денег. По сумме свойств думаю что на текущий момент он — оптимальный вариант по соотношению цена\качество.
Из недостатков — не самый удачный микрофон и не самый громкий динамик, но и то и другое на голову лучше чем у M5 Echo Atom. Из достоинств — всё остальное, прекрасный полуфабрикат для домашней автоматизации.
Всем спасибо за внимание!
Самые обсуждаемые обзоры
| +265 |
6692
171
|
| +76 |
5234
183
|
плюс здесь надо руки приложить и голову, а значит уже интересно