YUKAI ENGINEERINGお問い合わせはこちら

10分でわかる音声インターフェース設計非接触コミュニケーションの実用化技術とは?ビジネスに使える音声テック、音声UIの知識をご紹介

家の中にはユーザーインターフェースが一杯…

ユーザーインターフェースの種類

種類 物理UI CUI GUI ジェスチャーUI 音声UI
入力要素 ボタンスイッチ キーボード 指、手、腕
操作方法 押す・回す 命令の入力 ドラッグ&ドロップ、フリック等 指さし、手のひら動作 コマンド発話、自然発話
商品 固定電話・リモコン パソコンキーボード スマホ・タブレット モーションデバイス スマートスピーカー等
IFの特徴 学習コストが低い
機能が固定的
指示が正確で早い
両手が塞がる
機能拡張が容易
高齢者が苦手
近未来的な操作感
毎度やると疲れる
手ぶら操作が可能
発話は労力

※この表は横にスワイプしてスクロールできます

出典:音声に未来はあるか 河野2018

単体で全能なものはなく、ユーザー体験を実現するために組合せることが重要
(宅内にインターフェースが散乱しているのは個別最適を重ねた末路…)

音声インターフェースの基本機能

基本機能の6分類 できること
1. 音楽再生 音楽の再生、ボリュームの調整
2. 情報検索 知らない情報を入手(天気、ニュース、Wiki等)
3. 予定管理 スケジュール管理、アラームの設定
4. 連絡 メールの送信、電話、ビデオ通話の開始
5. 機器連携 スマート家電の制御
6. 雑談・エンタメ 目的の無い対話を楽しむための機能

殆どがGUI(スマホ)で実現可能(機能で勝負してはいけない)

ユカイ流・インターフェースの哲学

今、ユーザーインターフェースの流れは

ユーザーの行動変容を期待する場合、「つまらなさは害」でしかない

音声インターフェースの発話区分

基本機能の6分類 発話の区分
タスク型
何かを指示するため
非タスク型
対話そのものを楽しむため
1. 音楽再生 該当
スマートスピーカーがつまらないのは当然
・背景が音声アシスタント
・性能が評価しやすい
2. 情報検索
3. 予定管理
4. 連絡
5. 機器連携
6. 雑談・エンタメ 該当

設計時のタスク型と非タスク型(重めに)のバランスが重要

ユカイ流・対話が成立する仕掛け

言動

無視しない
  • 話者の方をくるっと向く
  • 音声認識が失敗したら悲しい反応
声を出すハードルを下げる
  • 独自のトリガーワード設定
  • トリガーワードなしで操作可に

コンテンツ

便利さだけを出さない
  • 外出、服薬リマインドは反応がない
一方的なウンチク語りにしない
  • 「成人式」「風邪予防」「大河ドラマ」といった目的のない内容と問いかけ
    (話者に話をさせるキッカケ作り)

音声インターフェースで用いられている技術

音声認識以外にも複数の技術によって音声インターフェースは構成

codamaとは

NTTドコモ様と共同開発した開発者向け音声対話開発キット
15,000円(税別)

<特徴>

  • トリガーワードを自分で設定可能
  • ノイズに強いマイクを利用可能
  • ラズパイを利用し気軽に試作

採用技術の概要

集音信号処理、信号処理が得意な半導体に任せる

4つのマイクの音をDSP(digital signal processor)が処理をして、その結果をRaspberry piに送っています。その結果、Raspberry piにとって音声認識は軽い処理になります。

1. ノイズキャンセリング

外部環境の定常的な音を削除する処理。
騒音を削除し、人の声だけを際立たせるようにしている。

2. エコーキャンセリング

自分が出している音を消す処理。
デバイス自身がスピーカーを有していると、話をしている間は大きなノイズになって、本来は聞くことができない。しかし、発生する音を把握できれば、その波形を消すことができる。

3. ビームフォーミング

ある特定の方向以外の音はノイズと判断して削除する処理。
複数のマイクの信号を計算することで方向を特定している。その上で、狙った方向と異なる音をノイズと捉える技術。

音声インターフェースの特徴とメリット

特長 メリット
1. 手ぶら操作が可能 両手が塞がっている、または他のインターフェースが利用できない状態でこそ真価を発揮
2. ショートカット(ステップ数削減) タスクを遂行するための作業ステップが少ない
3. コミュニケーション体験価値が生まれる 日本人は特に声から感情情報を理解するため音声は共感を得やすい
4. 感情や心理状況が反映される 声だからこそ「うっかり言ってしまう」ことも
5. 程良い認知レベルのメディア 音は「ながら作業」がしやすいメディアである(一方で無視されるリスクも高い)

特徴を理解した上でのサービス設計(その後のIF設計)が必要

音声インターフェースの問題点

問題点 その原因
1. 伝言ゲームの失敗 環境、ユーザーの発話、発話内容の問題
2. どう話したらいいか不明 発話の制約がないため、慣れが必要
3. 音声認識の精度 1の原因に依存するが失敗するケースがある
4. 発話は労力が必要 状況によっては手で操作した方が確実
5. ウェイクワードは面倒 集音開始タイミングを把握するため必要
6. 発話までの間が長い 現時点ではネットワークの制約がある

問題点を理解した上でのサービス設計(その後のIF設計)が必要

音声体験のデザインのポイント

ポイント
1. ユーザー体験の設計が先 VUIをどう活用するか?は間違った問の立て方
2. 従来のUIの弱点を補うこと 音声対話だけで完結しないことが多い
3. 会話のゴール(意図)の設定 対話シナリオやフローの定義はその後
4. ユーザーの前提を疑え ユーザーが何をすべきか知っていると思わない
5. ユーザー自身が学ぶ仕掛け 小さな成功体験の積み上げ、原因の明示

問題点を理解した上でのサービス設計(その後のIF設計)が必要

ケース:セコム株式会社様

超高齢化社会における新たな価値創造支援

Business Needs

  • • 超高齢化社会の根本問題である『支える人と、支えられる人の不均衡解消』のためコンシェルジュサービスを提供
  • • 電話のように、ご高齢者とのコミュニケーションがスムーズに実現できるデバイスを探していた

Solution

  • • 「セコム暮らしのパートナー久我山」のスタッフが、BOCCOを通じてご利用者と1日に複数回コミュニケーション
  • • その状況はご利用者のご家族、関係者とも連携し、そっと見守る

Outcome

  • 作方法を理解して使いこなせるまでに何度か繰り返し説明する必要があるものの、女性を中心に確実に有料利用者数が増加
  • 高齢者が抱える課題(服薬忘れや孤独など)の解決にも一定の効果があることが確認された
  • 今後は地域包括ケアの高齢者側インタフェースとしても展開予定

ケース:東京ガス株式会社様

共働き世帯を応援する生活サービス事業開発支援

Business Needs

  • • ガス・電力小売の自由化により、価格以外の差別化要素(サービス)が必須に
  • • 日中不在がちなファミリー層とのエンゲージメント強化に最適なプロダクトを探していた

Solution

  • • 出資先のオトバンクと連携し共働きで多忙な父、母を応援する「まかせて!BOCCO」を提供。毎日、童話をBOCCOが読み聞かせ

Outcome

  • 30~40代の共働き世帯を中心に顧客接点を構築
  • テレビと違ってお話を耳で聞くので、子供があれこれと想像して話してくれるのがとても楽しいです。5分程度ですが、毎日すごい集中力で聞いています。(40代女性)
  • BOCCO emoを活用し、更にコンテンツ拡充、ターゲットも拡大予定
ロボティクスソリューションについてのお問い合わせ

TEL:03-6380-4710
MAIL:sales@ux-xu.com
WEB:https://www.ux-xu.com/solution/

一覧へもどる

お問い合わせはこちら

ユカイのソリューションサービスを
動画でご紹介