テレヘッドから学ぶ-(その1)

システム事業部 松尾 浩義

図1

1. はじめに

世の中、ロボットブームといえるでしょう。ここ最近では動くものは何でもロボットと称している位浸透率が高いキーワードです。 マンガの世界だけでなくニュースとして新聞やテレビでも紹介される事も珍しくありません。日本がロボット先進国として名高い地位も確立している現在、 世間では子供からお年寄りまで、お茶の間でロボットコンテストの番組を楽しんでいる光景も今や珍しいものではなくなりました。 欧米で取り沙汰される様なロボットに対する反社会的、反宗教的な暗いイメージは微塵のかけらも無いのではないでしょうか。 さてそんな状況において、どの位の音響という観点から注視されて人々がいるのでしょうか。おそらく本誌を読んで頂いている方々なら既に関心を持たれていると思いますが、 一般的には、まだまだその動きや容姿そのものにしか注目が集まっていないのではないでしょうか?仮に工場などで動作するアーム型溶接ロボットならば、 それが素早く動作している様子はどういうイメージを与えているのでしょう。産業用ロボットにふさわしくとてもパワフルで、 かつ正確無比な動きを実践していると思います。同時にとても大きな駆動音を発していると思うのですが、 それよりその縦横無尽に、無人の工場内で、お互いに協調しながら黙々と仕事をする姿の方が、確かに、俄然インパクトがある様にも思えます。 ヒューマノイドロボットと言われる人間型のタイプならばどうでしょう?今や2本の足で走り回るパフォーマンスをニュースやイベントなどで見聞きもされているはずです。 前述の産業用ロボットとは違い、彼らには頭部があり人間の目や耳の様に機能する視聴覚センサを備えています。 ここで彼らが自身の耳(聴覚センサ)を澄ませて自分に命令を与えてくれる環境を聞き取ろうとしている姿を想像できるでしょうか? でも、人間型であるならば少しだけ感情移入しやすいかもしれません。一体どんな風に聞こえているのでしょうか? またその時、自身が発している音とどう区別しているのでしょう・・・。今回は、自身のモータや構成部品から発せられる騒音・振動を機構的に低減させる事により、 ロボットが音響情報を正確に取得することをサポートさせて頂いたメカトロニクス技術をご紹介しようと思います。

2. ロボット聴覚という研究分野

近年提唱されたこの分野では将来、人とのコミュニケーションを期待される家庭用ロボット等における重要なファクターである 「音声を正確に聞き取る能力」を実現する事を目的としてこれまで活発な研究活動が行われています。 弊社も微力ながらこの分野の業務をお手伝いさせて頂いていますが、小型な音響情報収集装置の開発から、ロボティクス、 音響信号処理、音声認識、対話処理までその裾野は大変幅広いと今さらながら実感しています。 また若い方々にはこの研究への意欲的な志を持たれる方々が大変多いのではないかと、昨年この分野の最新情報をテーマとした技術セミナーに参加した際にも、 その盛況ぶりを通じて改めて思いました。

3. サーボオン

モータにはたくさんの種類がありますが、ロボットに使用されるものはクローズドループであるサーボモータが多く見られます。 クローズドループというのは、例えば主要な命令である位置制御の為の入力パルスに対してモータ後部のエンコーダからフィードバックされるパルスの差(偏差) を見ることであり、サーボモータは通常、偏差がゼロになるように制御されます。しかし、慣性負荷が大きくなればなるほど、 偏差が小さくなるような正転逆転動作を頻繁に繰返するようになり、最悪の場合発振してしまいます。 慣性負荷の大きさと機構の剛性にあわせて最適なクローズドループ制御を行う調整を我々はゲイン調整と呼んでいます。 この調整を上手く行わないと、動作中だけでなく停止中の状態でさえも振動と異音だらけの使い物にならない状態になってしまいます。 このゲイン調整で導かれたロボットに瞬時にして魂を注入する最初のスイッチがこのサーボオンという操作です。 ロボットを動作させるアプリケーションの動作確認以前におこないますので、まさしく火を入れるという操作にふさわしいのですが、 静音駆動確認時にはこの時点でダメ出しをする事も多々あり、関係者一同肝を冷やしつつ、操作前には一時的に身構えてしまう事もあります。 そして起動・・・。その散々たる結果に実験室で落胆に打ち果ててしまう事もまれではありません。

4.動きながら聞く

前述の「1.はじめに」の項での設問の続きです。あらためて自分自身がヒューマノイドロボットに乗り移ってしまった状況を想像してみてください。 既にサーボオンしてアプリケーションは起動しています。何のエラーも起こりません。ゲイン調整も最高の出来です。 おかげで手足が敏速に動き、とても快調です。おや、何か聞こえてきます。かすかであるが、自分に問いかけている様です。 でも自身の機構が発する騒音や振動が邪魔してどこから声がするのか理解出来ません。誰が発しているのだろう。 言葉の意味は何だろうと、皆目見当がつきません。自分の目にはたくさんの人や物が映っているのに・・・誰? どこ・・うるさくて聞こえない・・。この後どうなってしまうのかはご想像におまかせしますが、 もし仮に「呼びかけ」に対して何も反応できないということはコミュニケーション以前の段階で既に不適合であり、 呼びかけた方からみれば無視されたという状況を演出した事になりムードは最悪です。

それでは、サーボオンを解除(サーボオフ)してモータを停止させて機構を一時的にブレーキロックしてみたらどうでしょう。 静かにはなりましたが、自分の視野からは誰も見あたりません。でも誰かが呼んでいると思います。後ろかな? うーん、どうしよう。サーボオンして振り向いてみるか・・・。この一旦停止してから音を聞くという動作は、 弊社のマイクロホン移動装置にも用いられている動作概念ですが(この場合、対象物は最初から特定されているので問題はありません)、 この操作は明らかにミスマッチですし、迅速なコミュニケーションとは言えません。ぺット型ロボットならまだしも、 何回呼んでもそっぽを向かれてしまうのでは、お互いに悲しい思いをするだけかもしれません。

少し前置きが長くなりましたが、「動きながら聞く」という行為に、大変大きな意味合いがあることに気付かされます。 前述の「ロボット聴覚」ではロボットを対象に、まさしく人の様に積極的に動作する事を取り入れてその聴覚の向上を目指す研究が行われています。 そして、その分野でも着目されているという、頭部の自発的な動きが聞こえに対する前後方向の判断や音像定位の向上に寄与するという緻密な研究成果がNTTコミュニケーション科学基礎研究所(神奈川県厚木市)より発表されます。 しかもこれを応用し実践するロボット(テレへッド)を作りたいと考えていると、直接弊社にお声がけ頂くまで、 今思い起こせば、そう長くは時間がかかりませんでした。時はすでに21世紀に突入しており、 新しい機運の風が世間を回り始めていたのではないでしょうか・・・。

図2

5. テレヘッドの概要

テレへッドとはダミーへッドがオペレータの頭部運動に追従して動作するロボットであり、 テレヘッドが聞く音響情報をヘッドホンを介してバイノーラル再生します。これにより遠隔な3次元音場をオペレータに伝える事が可能になるのですが、 ここで積極的に頭部を動かすという概念がポイントになります。動かなければ通常のダミーヘッド収録・再生と変わりは無いのですから。 しかも動く事で音源位置同定能力が向上するのですからバイノーラル再生との組合せでリアルな音場再生が可能になります。 ここで大変興味深いのは、信号処理等の複雑な処理を行わないという点です。違和感の無い自然な聞こえを目指すところは、 アウトプットがロボット自身の認識力ではなく人の耳・感性である事からも十二分に判断出来ます。 遠くの音がロボットを通じてリアルに聞こえるという事はまさに音環境に触れるというコミュニケーションを確立しているわけで、 テレヘッドの開発の矛先のひとつが音情報を正確に伝えるネットワーク構築であるという事も素直にうなずけます。 事情により会場に行けなくなったコンサートを居ながらにしてリアルに聴くことができる様になれば、 テレビやインターネットの2次元的な映像情報配信よりきっとおもしろいはずです。もちろん他の情報伝達を必要とする現場での利用価値も十分にあるわけで、 テレへッドを別名:聴覚プレゼンスロボット等と呼称されている辺りは、さすがと言わざるを得ません。

図3 遠隔地の3次元音環境を再現提示するテレヘッドの応用例
図3 遠隔地の3次元音環境を再現提示するテレヘッドの応用例

6. ダミーヘッドの製作

テレヘッドにはオペレータの頭部を正確に再現したダミーへッドが必要です。当初の仕様より、 市販の頭部形状の平均値に基づいたダミーヘッドを使うのではなく、軽量で、個々のオペレータの頭部形状再現を施した物を要求されていました。 しかも耳介部だけでなく、皮膚や瞳、髪の毛までも個々のモデルを再現したリアルなへッドを作ろうという事になり、 時間の許す限りその製作手法と業者の模索にあけくれる事になりました。当初より石膏による型取りは既知でしたが、 もう少しスマートな手法があるのではないかと思い、最新技術を調査すべく、「人形」や「型取り」等と名のつくところは、 金型、木型設計屋さんから3次元プロッタを使用した加工屋さんまでたずね歩きました。 時にはいかがわしい人形の製作現場までにも足を運び(こちらもリアルさにかけてはすごかったが・・・)、 やはりエンジニアリングより美術系なのかなと思いはじめたところに、光造形という手法を教えて頂きました。 これは金型を作る必要がなく、レーザーを照射すると硬化する液状材料を用いて積層していく自動造形技術で、 単品を短時間で製作する事が要求される試作の現場で大変重宝がられている立体モデル製作法です。 医療で使用されるMRIやレンジファインダと呼ばれる三次元計測装置(3Dスキャニング)を用いてモデルの頭部形状を取得出来る状況が、 この時点で整いつつありましたので、このデータをそのまま利用出来ると聞き、即飛びつきました。 しかし非常に小さい凹凸のある形状は後処理による形状データ修正に少し時間が必要で、重要な耳介部の再現までには至りませんでした。 しかし非接触による計測技術は驚嘆に値するもので、MRIと3Dスキャンで得られたデータは、 その後ダミーヘッド製作時の寸法チェックと完成時のモデルとの差異計測に利用させて頂きました。 光造形も3次元データさえあればその再現性は驚くほど正確(±0.1mm以内)なわけで、おまけに縮小拡大加工も可能なのですから、 応用範囲は大変広いと思います。同様に、ロボットの部品等に使用実積がある粉末焼結積層法による造形など新手の技術も常に業界を賑わしており、 今回その最新技術に触れることが出来て大変勉強になりました。

図4 ライフマスクによるダミーヘッドの製作工程
図4 ライフマスクによるダミーヘッドの製作工程

最終的にダミーヘッドの製作は映像現場等で特殊メイクや特殊造形を業務にされている会社(1号機は関西、 2号機は都内)にお願いする事になりました。実作業は、モデルの写真撮影から始まり、やはりモデルの型取りの工程を踏んでいきます。 近年は石膏ではなく「アルジネイト」という歯医者さんが歯の型取りに使用している素材と同じものを使用します。 石膏は熱いというイメージですがこの「アルジネイト」はヒンヤリとしていて、型取り当日、耳栓をして頭からスッポリ覆われて硬化するまで待つこと20分位。 眼が虚ろなモデルさんは口々に「何も聞こえない深海の中にたたずんで居たみたい」と言われます。耳は左、右別々に型取りを行います。 その後の工程は図示のとおりですが、このダミーへッド製作仕様の中で重要なポイントが数点ありましたので記述致します。

1) マイクロホンの位置は耳道入り口付近に取り付けられ、交換が可能なこと
但し振動がマイクロホンに伝わりにくい構造であること

2) ロボット本体との接合と切り離し、または違うヘッドとの交換取付が容易であること

3) 構造は2層として、そのシリコーンゴム製外皮の部分とFRPによる骨格部分の取り外しが可能であること(2号機)

4) モデルの寸法・形状の忠実な再現

これらの内、1)と3)の項目はその後の騒音・振動低減の作業の中で十分な役目を果たすことになります。
またライフマスク(生きている人間の顔型)を利用するダミーへッドを製作するに辺り、そのコツも少し付記させて頂きます。

  • 現段階では、「誤差軽減」「仕上がり」等、型取りによる製作方法に勝るものはないと思われます。

  • 型取りの段階では多数写真撮影をしてもらい容姿の模写だけでなく寸法の照合にも利用してもらう様相談しておいた方が良いです。 また重要な位置の寸法は巻尺や長い定規などを利用してこの時点で測定しておいてもらいます。

  • 可能であれば非接触による計測方法により頭部形状のデータを持ち合わせておく。MRI、CT、3Dスキャニング等。 これらも寸法の照合に利用してもらう様に閲覧可能CADデータに変換出来れば、フルスケールの紙媒体への印刷も可能になり、 良い参考資料になると思います。

  • 外皮(人口皮膚)については業者の方に相談。シリコーンゴムひとつとっても多種にわたり、調合方法もさまざま。 音響インピーダンスや制振という観点からも小さいサンプルを製作してもらい判断した方が良い。 映画・放送関連業界が進んでいる様です。

  • 重量は、2kg前後がベター。軽すぎると、その材質上形状が変形し易すくなる傾向にあり再現性に問題が生じます。 逆にこれ以上重くなるとテレヘッドの構造上、制御面から不利。ちなみに市販のダミーヘッドは4kgを越えているものが多く見受けられる様です。

  • ダミーヘッドが完成したら、最大限の情報を使い、モデルとの寸法の差異測定を行います。 おそらくどのデータにも何らかの誤差が含まれていると思われますので、その基準指針を当初より関係者が共有していた方がスムーズかと思われます。

  • ロボットの接続方法は、業者間調整が必要です。特にダミーへッド側は、正確な基準点がないので数値だけでは追い込めない場合があります。 金具側でその位置出しを補正するような策が必要だと思います。

図5 型取り素材でモデル頭部を被います
図5 型取り素材でモデル頭部を被います

7. テレへッドの基本要求仕様

ロボット本体部分は当初より胸部まで製作することになっていました。これは頭部伝達関数計測の誤差を抑制する為と、 機構部をこの胸部を型取ったいわゆるボディ型の箱で多い隠すことで遮音効果と視覚的なデザイン効果を狙う為です。 2号機にいたってはシャツも着用しています。自由度は、ピッチ軸、ロール軸、ヨー軸の3つです。 これはオペレータの頭部に着用するへッドトラッカ(Palhmus社製のFastrak)との連携も考慮しており、頭部運動の再現に必要な最低限の軸数でもあります。 ピッチ軸は人の首の動きの屈曲・伸展の方向に相当し、数名を実測されたデータによれば約110°(屈曲47°、伸展63°)の可動範囲があり、 ロール軸(側屈方向)は片側45°、ヨー軸(回旋方向)は片側69°との事で、この数値を参考に本体の可動領域仕様として設計に組み込まれることになりました。 頭部運動速度についても同様に実測されたデータを頂戴する事が出来たのですが、その数値が驚きです。 何と回旋方向だけでも、最大速度382°/秒、加速度は5644°/秒2という計測結果なのです。関係者一同、 あらためて人間のメカニズムに感心させられてしまいました。通常約5kgといわれる重い頭部をこれだけ高速に無音駆動できるのですから・・・ (皆さん、首を振ってみましょう!)。そして負荷となるダミーへッドの重量が予測され、およそ2kg前後にはなりそうだという結果です(最終、 1号機の段階で約1kg、2号機の段階では約2.2kg以上)。大変な重量物だなと印象を受けました。 しかもその仕様に加えて前述の可動領域及び最大運動速度。そして課された目標値の動作音NC-45以下&オペレータの頭部運動に追従しなければいけない速度が80ms。 本体の基本概念は静粛性に優れ、機敏な動作が可能な腕無しヒューマノイドの上半身を作るというものであり、 機構部はヒューマンボディラインから決して突出・露出してはいけないなど・・・。正直計画の時点で「これは無茶だ」と直感的に思いました。 経験したことのない事ばかりの内容につい言葉を失い考え込んでいたところ、当時の責任者の方に声をかけて頂きました。 「この研究を単年度で終わらせるつもりはありません。仕様の軽減や改良・改造も視野に入れています。 実現に向けてぜひ協力して頂きたい」勿論、これが発奮剤となり筆者のチャレンジ精神に火が点いたのは言うまでもありません。

8. テレへッド1号機

ギヤレスは設計以前の重要ファクターです。しかし、これだけの負荷とその加速度を細い筐体構造の中の機構で制御せねばならず、 最初の機構選定には相当に時間がかかりました。アイデアとしては江戸時代のからくり人形をモチーフにしています。 モータの選定の段階では当初よりDD(Direct Drive)モータと呼ばれるギヤレスモータを使用する事を念頭に入れていました。 医療の分野で、運動刺激装置として使用されている回転椅子を過去に見聞していたのがその理由です。 人のめまいの診断に利用されるため、着座して高速回転しても非常に小さい駆動音であることが特長でしたので、 1号機のベース部にはこの回転椅子の機構を利用したかったのです。これでヨー軸(回旋)候補を早期には決めることになるのですが、 一方でこの発案が最後まで尾を引くことになります。当時はヨー軸の上にピッチ軸、 ロール軸を積み重ねて大きなトルクをもつこのDD(ヨー軸)で上部を支えるという思想から離れることが出来ませんでした。 ピッチ&ロール軸の駆動機構の構造はラジコンヘリコプターのスワッシュ・プレートという部品をヒントにしました。 高速回転するメインロータ(プロペラ)を指定方向にヘリを進める際に回転ロスなく、 しかもほぼ同軸上に傾きを生み出す機構に引き付けられました。精密な部品の数こそ多いものの、 組み構造は人の骨や筋肉を連想させる大変スマートな形でしたので、勇んでラジコン屋さんに駆け込みました。 しかし大量生産ならともかくリンク機構を一から製作するには手間がかかりすぎるという事で、その模擬は断念しました。 ただし方針は変えたくなかったので、とにかくこれをイメージとして違うアイデアを捻り出そうと、 方々にたずね回りました。リンクが難しいならワイヤーならどうでしょう?そう提案してくれたのは、 弊社のマイクロホンローテータMR-1000の設計・製作で御世話になっている東京精機株式会社の片桐社長です。不安はありましたが、 既にロボットの手足等ワイヤーで駆動させる機構を大変コンパクトに収めている数々の実積とワイヤリングによる減速構造が想像以上に大変静かであった事が後押して1号機に採用する事に決めました。

1号機の基本仕様は下記のとおりです。

* 使用モータ
ピッチ軸(屈曲・伸展) ACサーボモータ(400w)安川電機製
ロール軸(側屈) ACサーボモータ(400w)安川電機製
ヨー軸(回旋) DDサーボモータ(トルク2.1Nm,120rpm時)
新明和工業製
* 本体寸法 W464×H800×D464mm
* 可動領域 ピッチ軸 80°(屈曲方向54°、伸展方向26°)
ロール軸 30°(側屈方向片側)
ヨー軸 90°(回旋方向片側)
* 最大運動速度 300°/sec以上
* 駆動方式 ワイヤ+プーリー駆動(ピッチ&ロール軸)
ダイレクトドライブ駆動(ヨー軸)

図6 型取り素材でモデル頭部を被います

9. 1号機から学んだこと・・・。

残念ながら、完成した1号機の性能は、前述の駆動音、追従性の目標値に到達する事ができず、 期待をかなり下回るものになってしまいました。構造にいたっても、その駆動音の軽減の為に分厚いウレタンフォームのカバーで覆わなければならず、 スマートな形にすることも出来ませんでした。またダミーへッドにおいても実頭との形状差が最大10%もあり両者の頭部伝達関数が多くの方向で一致しなかったと報告されています。 しかし我々はこの経験を生かして多くのことを学びとることが出来たと考えています。その時の主な反省点を下記に示してみました。 大変長くなりましたが、今回はこれにて終了したいと思います。次回はこの1号機の教訓を生かして完成に漕ぎ着けた2号機について、 その騒音・振動対策を測定データをまじえながら解説出来ればと考えています。

  • 人間の頭部運動は慣性負荷が想像以上に大きい。駆動系が低剛性に対応しようとするならば、 多次にわたるねじれ構造を増長する様な軸の積み上げによる組合せや部品選定は避けなければならない。また緩み、 ガタでさえも極力抑えて、総合的に剛性をあげていく努力が必要である。

  • 例えDDモータでもベアリング音には注意を要する。

  • ワイヤー駆動は静音に優れているが、そのものの伸縮もありトルク伝達が瞬時に行えない。

  • ピッチ&ロール軸の交点の軸受けにオフセットが生まれてしまい、理想的なジンバル構造に出来なかった。 1自由度の転がり軸受を2段階上下に組み合わせる機構になりそれぞれが単独に駆動できず、並列軸駆動中、 部分的に堅さが生まれてしまい、滑らかに動作できない。円滑なパラレルメカニズムをサポートする軸支持機構(球面軸受けなど)が必要。

  • 安易なPWM駆動方式は高い周波数(約2KHz以上)成分の駆動音を増長する。 その電磁ノイズの影響も考慮しておかなければならない。

  • サーボオン起動時における停止状態、及び動作中のクローズドループ制御がモータ駆動音に与える影響は前述のPWM駆動と切り離してもかなり大きい。 トルク負担の少ない重心位置に機構を集中できると軽減できる可能性がある。

  • 既存のモータドライバのゲイン調整だけでは、低剛性メカニズムにおいて、 ベターな追従動作と静音駆動を導くには不十分。 少なくとも、モータの振動を抑える周波数領域の補償法(フィルタ)を別途検討した方が良い。

  • ライフマスクによるダミーヘッドは、美術品としての価値も存在するので、 綿密な打合せと余裕のある作業工数を準備する必要がある。




参考文献:

  1. 植松 尚、柏野牧夫、平原達也、“頭外音像定位における自発的な頭部回転の影響、”日本音響学会講演論文集、501-502(2001)

  2. 戸嶋巌樹、植松 尚、青木茂明、平原達也、“頭部運動を再現するダミーヘッド:テレヘッド“ 日本音響学会誌61号4号、197-207(2005)

  3. 平原達也、戸嶋巌樹、植松尚:“頭部運動に追従するダミーヘッドシステム-テレヘッドⅡ -”、人工知能学会第17 回 AI チャレンジ研究会資料、51-58( 2003)