サンプルMOD

ｽﾀｯｸﾁｬﾝのユーザアプリケーション（MOD）のサンプル集です。 MODの書き込み方法はプログラムのビルドと書き込みを参照ください。

プログラムのビルドと書き込みのところでも記載していますが、modを書き込む時、ポートが見つからず "/bin/sh: 1: [[ not found"のメッセージが表示され書き込みができないことがあります。その時は、npmの前にポートを指定します。
以下はwindows(WLS2)のmods/cherrup_ble_liteを書き込むときの例です。

$  UPLOAD_PORT=/dev/ttyACM0 npm run mod --target=esp32/m5stack_cores3 ./mods/cheerup_ble_lite/manifest.json

一部のMODは動かすためにネットワーク接続や外部のサーバなどを準備を準備する必要があります。

Look Around: きょろきょろｽﾀｯｸﾁｬﾝ(windows/Ubuntu/mac)

環境設定時のAボタンに入っている動作と同じです。
ホストのビルド時に、Wi-Fiの設定は不要です。
- $ npm run build --target=esp32/m5stack_cores3
ホストのプログラムを書き込みます。
- $ npm run deploy --target=esp32/m5stack_cores3
modの書き込み
- $ npm run mod --target=esp32/m5stack_cores3 ./mods/look_around/manifest.json
ｽﾀｯｸﾁｬﾝの顔が出たらAボタンを押すと動作します。
look_around

Monologue: ぽしょぽしょ独り言ｽﾀｯｸﾁｬﾝ(Ubuntu/mac)

windowsはWi-Fiブリッジが正常に動作しないため対象外になります。
TTS(合成音声)を使用して音声を再生します。TTSの使用については、こちらを参照ください。
ここでの動作確認は、VoiceVoxを使った事前生成を使った方法のインストール方法を紹介します。
TTSエンジンVoiceVoxをクローンします。
- $ git clone https://github.com/VOICEVOX/voicevox_engine.git
dockerを使って起動します。dockerのインストールは https://docs.docker.com/engine/install/ubuntu/ を参照してください。
- $ sudo chmod 777 /var/run/docker.sock
- $ docker pull voicevox/voicevox_engine:cpu-ubuntu20.04-0.21.1
- $ docker run --rm -p 50021:50021 voicevox/voicevox_engine:cpu-ubuntu20.04-0.21.1
TTSの環境を設定します。
- stack-chan/firmware/stackchan/manifest_local.jsonにあるttsのhostのアドレスをdockerを起動したPCのIPアドレスに修正します。
JavaScpiptファイルに発話する文章を書き込みます。ランダムで発話します。
- JavaScrptファイル : stack-chan/firmware/mods/monologue/speeches_monologue.js
ホストのビルド時に、Wi-Fiの設定が必要になります。Wi-Fiは2.4Gに接続してください。
- $ npm run build --target=esp32/m5stack_cores3 ssid="SSIDの名前" password="SSIDのパスワード"
ホストのプログラムを書き込みます。
- $ npm run deploy --target=esp32/m5stack_cores3
modの書き込み
- $ npm run mod --target=esp32/m5stack_cores3 ./mods/monologue/manifest.json
ｽﾀｯｸﾁｬﾝの顔が出たらAボタンを押すと動作します。
monologue

Cheerup: ｽﾀｯｸﾁｬﾝ応援団(windows/Ubuntu/mac)

PCとｽﾀｯｸﾁｬﾝを一対一でBLEで接続します。
PCにwebカメラが必要になります。
まだ不具合があり音声の応援、顔の表情の変化はできません。追従のみ対応しています。
webソケット版は、未検証です。
ｽﾀｯｸﾁｬﾝの設定
- ホストのビルド時に、Wi-Fiの設定をしないでください。
  - $ npm run build --target=esp32/m5stack_cores3
- ホストのプログラムを書き込みます。
  - $ npm run deploy --target=esp32/m5stack_cores3
- modの書き込み
  - $ npm run mod --target=esp32/m5stack_cores3 ./mods/cheerup_ble_lite/manifest.json
PC側の環境設定
- セキュリティの問題がありブラウザはChromeのみ対応しています。
- windowsの場合nodeを18.12以上にする必要があります。
  - $ volta install node@18
- ブラウザからBluetoothへのアクセスができるようにExperimetal Web Platform featuresのフラグを有効にする必要があります。
  - chromeのURLにchrome://flags を入力し、Experimetal Web Platform featuresを停止から有効にします。
- https://github.com/meganetaaan/suburi-mediapipe をクローンします。
  - $ git clone https://github.com/meganetaaan/suburi-mediapipe
- 必要なツールをインストールします。
  - $ sudo apt install -y curl
  - $ curl -sS https://dl.yarnpkg.com/debian/pubkey.gpg | sudo apt-key add -
  - $ echo "deb https://dl.yarnpkg.com/debian stable main" | sudo tee /etc/apt/sources.list.d/yarn.list
  - yarnのツールのインストール
    - ubuntu : $ sudo apt update && sudo apt install yarn　(voltaが入っていない場合)
    - ubuntu : $ sudo apt update && volta install yarn とyarn install (voltaが入っている場合)
    - macOS : $ brew install yarn
    - Windows : $ volta install yarn と yarn install
  - $ npm install react react-dom
- google-chromeをインストール(windowsでwlsからchromeが認識しない時)
  - $ sudo apt update
  - $ sudo sh -c 'echo "deb http://dl.google.com/linux/chrome/deb/ stable main" >> /etc/apt/sources.list.d/google-chrome.list'
  - $ sudo wget -q -O - https://dl-ssl.google.com/linux/linux_signing_key.pub | sudo apt-key add -
  - $ sudo apt install google-chrome-stable
- opensslのバージョンとnodeのバージョンの互換性のため以下のコマンドが必要になります。
  - ターミナルを開くたびに以下のコマンドが必要になるため、毎回打ち込むかbashrcに追加する必要があります。
    - $ export NODE_OPTIONS=--openssl-legacy-provider
- node_moduleに書き込み権限がないとエラーが出た場合、cacheに書き込み権限を追加します。
  - $ sudo chmod 777 /home/ubuntu/suburi-mediapipe/frontend/node_modules/.cache
- ツールはdocker compose upで起動できますが、各OSで共通して起動する手順を示します。
  - node_modulesをfrontendとbackendにインストールします。
    - $ cd /home/ubuntu/suburi-mediapipe/backend
    - $ npm install react-scripts
    - $ cd /home/ubuntu/suburi-mediapipe/frontend
    - $ npm install react-scripts
  - frontendとbackendの2種類を起動します。
  - 一つ目のターミナル
    - $ cd /home/ubuntu/suburi-mediapipe/backend
    - $ yarn start(windowsはsudoが必要)
  - 二つ目のターミナル
    - $ cd /home/ubuntu/suburi-mediapipe/frontend
    - $ yarn start(windowsはsudoが必要)
- chromeが自動起動しない場合、URLに http://localhost:3000/sandboxes/stackchan/facesync を入力します。
- chromeにｽﾀｯｸﾁｬﾝが表示されたら下の方にあるConnection MethodをWebSoketからbluetoothに変更し、connectをクリックします。
- http://localhost:3000がペア設定を求めてきます。stkを選択し、ペアリングします。
cheerup_ble_lite: BLE版
cheerup_ws: WebSocket版

Mimic: まねっこｽﾀｯｸﾁｬﾝ

ｽﾀｯｸﾁｬﾝが2台必要になります。
mimic_main: ユーザが動かすほう
mimic_follow: まねして動くほう

Face Tracker: 顔を追いかけるｽﾀｯｸﾁｬﾝ(Windows/Ubuntu/mac)

ｽﾀｯｸﾁｬﾝとM5Stack UnitV2が必要になります。
UnitV2の設定
- UnitV2のドライバをインストールします。Ubuntuはインストール不要です。
  - https://docs.m5stack.com/ja/guide/ai_camera/unitv2/base_functions
- Wi-Fiの設定をします。
  - USBでPCとUnitV2を接続し、ターミナルからUnitV2にログインします。
    - $ ssh m5stack@10.254.239.1
    - パスワードは 12345678 です。
  - 使用するSSIDのパスワードをパスフレーズに変換して/etc/wpa_supplicant.confに書き込みます。
  - SSIDのパスワードをパスフレーズに変換するコマンド
    - $ sudo wpa_passphrase Wi-FiのSSID　Wi-Fiのパスワード
  - wpa_supplicant.contをルート権限で開き、先ほど生成したパスフレーズとSSIDを書き込みます。
```
 network={
 	ssid=”Wi-FiのSSID”
 	psk=生成された暗号文
 }
```
- Chromeを開き、URLにhttp://10.254.239.1 を入力します
- Face Detectorを選択して顔のデータが出力します。
ｽﾀｯｸﾁｬﾝの設定
- ホストのビルド時に、Wi-Fiの設定が必要になります。Wi-Fiは2.4Gに接続してください。
  - $ npm run build --target=esp32/m5stack_cores3 ssid="SSIDの名前" password="SSIDのパスワード"
- ホストのプログラムを書き込みます。
  - $ npm run deploy --target=esp32/m5stack_cores3
- modの書き込み
  - $ npm run mod --target=esp32/m5stack_cores3 ./mods/face_tracker/manifest.json
face_tracker

Face: ｽﾀｯｸﾁｬﾝの表情と顔色の変化(Windows/Ubuntu/mac)

顔の表情と顔色を順番に変化します。
modのインストール方法
- ホストのビルド時に、Wi-Fiの設定は不要です。
  - $ npm run build --target=esp32/m5stack_cores3
- ホストのプログラムを書き込みます。
  - $ npm run deploy --target=esp32/m5stack_cores3
- modの書き込み
  - $ npm run mod --target=esp32/m5stack_cores3 ./mods/face/manifest.json

おしゃべりスタックチャン(Ubuntu)

CharGPTを使ってスタックちゃんと会話をします。
macOSは対象外になります。
windowsはWi-Fiブリッジが正常に動作しないため対象外になります。
アプリからChatGPTを起動するには有料プランが必要になります。
使用するsimple-stt-serverが要求しているnodeのversionが16から20になっています
PSRAMを使用していないため長い文章を話すことができない状態です。 -PC側の設定
- Windowsは以下の音声認識のためwindows側でpulseaudoのインストールが必要になります。
  - Windows11側のインストール
    - Pulse Audio On Windowsをダウンロードしインストールします。
      - https://www.freedesktop.org/wiki/Software/PulseAudio/Ports/Windows/Support/からzipfile containing preview binariesをクリックしてダウンロードします。
      - C:\Users\ユーザー名\pulseaudio-1.1に展開します。
      - C:\Users\ユーザー名\pulseaudio-1.1\etc\pulse\default.paを編集します。
        
        #load-module module-native-protocol-tcpとload-module module-esound-protocol-tcpのコメントを外してipアドレスを追加します
        
        load-module module-esound-protocol-tcp auth-ip-acl=127.0.0.1;172.16.0.0/12
        
        load-module module-native-protocol-tcp auth-ip-acl=127.0.0.1;172.16.0.0/12
      - C:\User\ユーザー名\pulseaudio-1.1\etc\pulse\daemon.confを編集します。
        
        セミコロンを外して数字を20から-1に変更します。
        
        exit-idle-time = -1
    - Pulse Audioを起動します
      - C:\User\ユーザー名\puseaudio-1.1\bin\pulseaudio.exeをダブルクリックで起動します。一度目はすぐに終了してしまいます。もう一度ダブルクリックして起動します。エラーがありますが、終了しないのであればせそのままにします。
      - Windowsを起動するたびにpulseaduio.exeを起動する必要かあります。
  - WSL側のインストール
    - 必要なライブラリをインストールします。
      - $ sudo apt install alsa-utils
      - $ sudo apt install libpulse0
      - $ sudo apt install -y pulseaudio
    - WebSocketサーバの環境整えます
      - $ git clone https://github.com/meganetaaan/simple-stt-server.git
      - $ cd simple-stt-server
      - nodeが新しいとインストールできないためnodeのバージョンを16にします。 $ volta install node@16
      - $ npm install
    - VOSKのモデルをダウンロードしsimple-stt-serverのしたにmodelのフォルダーを作りダウンロードした出たデータを展開した状態でコピーします。
      - ダウンロードするデータ https://alphacephei.com/vosk/models/vosk-model-ja-0.22.zip
      - windowsからsimple-stt-serverのフォルダーにアクセスするにはエクスプローラーの左にあるLinuxのフォルダーがアクセスすることができます。Linux/Ubuntu-22.04/home/ubuntu/simple-sst-server
    - PULSE_SERVERの環境変数を設定します。~/.bashrcの最後に次の二行を追加します
      - export HOST_IP="$(ip route |awk '/^default/{print $3}')"
      - export PULSE_SERVER="tcp:$HOST_IP"
- Ubuntu
  - 必要なliblaryをインストールします
    - sudo apt install alsa-utils
    - sudo apt install alsa-tools
  - WebSocketサーバの環境整えます
    - $ git clone https://github.com/meganetaaan/simple-stt-server.git
    - $ cd simple-stt-server
    - $ npm install
  - VOSKのモデルをダウンロードしsimple-stt-serverのしたにmodelのフォルダーを作りダウンロードした出たデータを展開した状態でコピーします。
    - ダウンロードするデータ https://alphacephei.com/vosk/models/vosk-model-ja-0.22.zip
- 続きは、WSLとUbuntu共通になります。
  - 音声認識を起動します。
    - simple-stt-serverのところで以下のコマンドを実行します。
      - $ npm start -- --device default
  - ChatGPTからの返答の文章をｽﾀｯｸﾁｬﾝの発話に変換する音声合成サーバーのvoicevox_engineをクローンします。
    - $ git clone https://github.com/VOICEVOX/voicevox_engine.git
  - dockerを使用して起動します。dockerのインストールは https://docs.docker.com/engine/install/ubuntu/ を参照してください。
    - $ sudo chmod 777 /var/run/docker.sock
    - $ docker pull voicevox/voicevox_engine:cpu-ubuntu20.04-0.21.1
    - $ docker run --rm -p 50021:50021 voicevox/voicevox_engine:cpu-ubuntu20.04-0.21.1
ｽﾀｯｸﾁｬﾝ側の設定
- manifest_local.json (stack-chan/firmware/stackchan/manifest_local.json) のconfigに必要な設定を追加・変更します。
  - ChatGPTのトーク : 取得したChatGPTのトークン
  - IPアドレス : 自分のPCに割り当てられたIPアドレス
```
 {
 	"include": [
 		"./manifest.json"
 	],
 	"config": {
 		"ai": {
 		"token": "ChatGPTのトークン"
 		},
 		"tts": {
 			"type": "voicevox",
 			"host": "IPアドレス",
	 			"port": 50021
 		}
 	}
 }
```
- stack-chan/firmware/mods/chatgpt/mod.jsで定義されているｽﾀｯｸﾁｬﾝに使用するChatGPTのモデルに変更します。ここでは、gpt-40にします。
```
 	const STT_HOST = 'stackchan-base.local'
 	// const MODEL = 'gpt-4'
 	// const MODEL = 'gpt-3.5-turbo'
 	const MODEL = 'gpt-4o'
```
- ホストのビルド時に、Wi-Fiの設定が必要になります。Wi-Fiは2.4Gに接続してください。
  - $ npm run build --target=esp32/m5stack_cores3 ssid="SSIDの名前" password="SSIDのパスワード"
- ホストのプログラムを書き込みます。
  - $ npm run deploy --target=esp32/m5stack_cores3
- modの書き込み
  - $ npm run mod --target=esp32/m5stack_cores3 ./mods/chatgpt/manifest.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

サンプルMOD

Look Around: きょろきょろｽﾀｯｸﾁｬﾝ(windows/Ubuntu/mac)

Monologue: ぽしょぽしょ独り言ｽﾀｯｸﾁｬﾝ(Ubuntu/mac)

Cheerup: ｽﾀｯｸﾁｬﾝ応援団(windows/Ubuntu/mac)

Mimic: まねっこｽﾀｯｸﾁｬﾝ

Face Tracker: 顔を追いかけるｽﾀｯｸﾁｬﾝ(Windows/Ubuntu/mac)

Face: ｽﾀｯｸﾁｬﾝの表情と顔色の変化(Windows/Ubuntu/mac)

おしゃべりスタックチャン(Ubuntu)

Uh oh!

FilesExpand file tree

README_ja.md

Latest commit

History

README_ja.md

File metadata and controls

サンプルMOD

Look Around: きょろきょろｽﾀｯｸﾁｬﾝ(windows/Ubuntu/mac)

Monologue: ぽしょぽしょ独り言ｽﾀｯｸﾁｬﾝ(Ubuntu/mac)

Cheerup: ｽﾀｯｸﾁｬﾝ応援団(windows/Ubuntu/mac)

Mimic: まねっこｽﾀｯｸﾁｬﾝ

Face Tracker: 顔を追いかけるｽﾀｯｸﾁｬﾝ(Windows/Ubuntu/mac)

Face: ｽﾀｯｸﾁｬﾝの表情と顔色の変化(Windows/Ubuntu/mac)

おしゃべりスタックチャン(Ubuntu)