「いい音(音質)」とは、一体何なのでしょうか。
我々インビジも、音に携わっている者として「いい音(音質)とは?」と誰かに聞かれたり、自分自身で考えてみたりすることがあります。
音質を表す言葉のひとつに”Hi-Fi”や”Lo-Fi”があります。
Hi-Fi(ハイファイ)とは、字義的には”High Fidelity”(高忠実度、高再現性)の略語です。
音響機器などにおいて「原音や原画に忠実な再現」という意味を持ち、録音や録画し再生する場合に発生するノイズやひずみが最小限に抑えられていることを指します。
また、Lo-Fi(ローファイ)は “Low Fidelity”、つまり低音質を意味しますが、音楽の世界では、歪んだビートやテクノロジーのエラーがクールでユニークなサウンドを生み出している場合もあります。
第10回目のSOUNDABOUTでは「いい音(音質)とは?」というテーマの下、音に関わるプロダクトを手掛けている電通CXCC CXテクノロジー部、クリエイティブ・テクノロジストの土屋 泰洋(ツチヤ ヤスヒロ)さんをお招きし、過去の制作秘話なども交えつつ、インビジの小田部さん、高花さんと共にSOUNDABOUTしていきます。
ゲスト:土屋 泰洋 (電通CXCC CXテクノロジー部)
ファシリテーター:CD HATA、小田部剛、髙花謙一
- 土屋 : 電通のCXCC(カスタマー エクスペリエンス クリエーティブ センター)のCXテクノロジー部という部署で、リサーチャー、クリエーティブ・テクノロジストという肩書きで活動しています。
主にCXと呼ばれる、消費者が実際にモノを見たり触れたりするところも含めて、プロダクトそのものをどうデザインしていくかということを考えるお仕事をしています。
- CD HATA : よろしくお願いします。土屋さんは、音に関わるプロダクトにも関わられていると思うのですが、お客さん達はどのように「音」を感じてくれるものなのでしょうか。
- 土屋 : そうですね。僕が電通で関わっている仕事でいうと、わかりやすい事例で言うと2009年ぐらいの「ニューロウェア」のプロジェクトですかね。
脳波センサーをどう活用していくか、という思考実験から始まったプロジェクトです。元々はサンノゼにあるニューロスカイという会社が開発しているかわいい形の脳波センサーがあるんですが、それを頭につけるだけで頭の中の状態をある程度測ることができるので、それを使って何か面白いことを考えていこうとしているグループに所属しています。
その中で商品化したものもあります。
「necomimi(ネコミミ)」という、最近2も出たのですが、脳波センサーが付いていて、集中しているときは耳がぴょこっと立ち、リラックスしているときは耳が寝るというロボット猫耳のような商品を開発しました。
また、音楽関係だと、これはSXSW(サウス・バイ・サウスウエスト)にも持っていったんですが、慶應義塾大学との共同研究として「特定のジャンルの音楽を聞いてるときに、人の脳波はどのような反応をするのか」というデータを、脳波センサーを使ってひたすら取りました。
何か音楽を聴くときにヘッドホンを付けると思うのですが、そのときにわざわざ曲を選ぶのが難しいみたいなときってあると思うんですよね。iPodの中にいっぱい曲が入りすぎていて、どれを聴こうか悩む、みたいな。
そんなとき、何かすごく神がかったシャッフルをiPodがやってくれると理想的だなと思っています。今の気分に合わせて音楽が自動的にいい感じに選ばれるように、ヘッドフォンと脳波センサーを一緒にして、脳の今の状態を脳波センサーで測定し、その脳波のパターンに一番近い音楽を自動的に選曲してかけてくれるという仕組みを開発しました。
- CD HATA : 脳波を自動で読み取ってそれに合わせてDJをしてくれるんですか。
- 土屋 : そうですね。そんな感じです。
脳波から取れる情報は実はそこまで多くないのですが、実験的に現場でもやってみようということになりました。
LIQUIDROOMの横にあるKATAというスペースで「Brain Disco」というイベントを開催したんですが、実際にイベント中にお客さん20人くらいに脳波センサーを配って装着してもらって、どのくらい音楽に集中してるのかというのを測定してポイントを表示するようにしたんですよ。お客さんが全員がノってればポイントが上がるし、ノっていなければポイントが下がるという仕組みです。
ポイントが下がっていくとどんどんDJのポイントも減っていって、ゼロになると強制的に交代をする、というリアルビートマニアみたいな感じでイベントをやりました。
- CD HATA : DJで検証するって結構シビアですね。
- 土屋 : そうですね。すごく皮肉だったのが、お客さんの集中度が一番バーンと上がるときって、いきなり無音にするときなんです。
- CD HATA : 無音を挟むことで集中度が上がるんですね。
土屋 : はい。他にも、ハウスなどの音楽をかけているときにわざとスクラッチしてみたりとか、色々と気を引くための工夫をしたりして、DJ側もポイントをゼロにしないように普段とは違う工夫しているような感じでしたね。
- CD HATA : 他にも何か携わっていることはありますか?
- 土屋 : そうですね。脳波周りは他にも色々とやっていて、まさにインビジさんとも一緒にお仕事をさせていただいています。最近ですと、パラリンピックの開会式にも出演されていた、ご自身もALS(筋萎縮性側索硬化症)患者で、WITH ALSというALSの啓蒙活動をされている武藤将胤さんのプロジェクトがあります。 「BRAIN RAP」というプロジェクトで、武藤さんが脳波でキーワードを選択して、その選択したキーワードからAIがラップのリリックを自動生成し、それをラッパーの方に音楽に乗せてラップをしていただくという結構大がかりな仕組みを一緒に開発させていただきました。
- Otabe : :その節は大変お世話になりました。インビジでは僕ともう一人、フリーで活動している白石くんというプログラマーの2人で携わったのですが、主にビジュアライズ周りの開発を担当しました。
- CD HATA : 実際にやってみて何が面白かった?
- Otabe : なんでしょうね…意外とラップできちゃうんだなというところ?
- 土屋 :(笑)。ラッパーの方の吸収力と対応力がすごいんですよね。多少言葉が破綻していても全然カバーできちゃうんです。なので現場任せのところも結構ありましたね。
- CD HATA : :実際に会場でパフォーマンスをされるんですか?
- 土屋 : はい。僕らの方では、提示されたキーワードを脳波で選べる仕組みを開発しました。 色々な方向からサイン波だとか鳥の音だとか色々な音が同時に鳴るんですけど、どの音に集中しているのかを脳波で分類する仕組みを作って、例えば、あるキーワードを選びたいときは鳥の鳴き声に集中するという入力システムを作って、ライブ中武藤さんにはヘッドフォンをつけていただいて、自分の意志でキーワードを選んでもらえるようにしました。
キーワードが選ばれた後の仕組みは朝日新聞メディアラボの浦川さんが開発されています。選んだキーワードをもとに、過去に武藤さんが書いた文章などから近い単語を自動的に抽出し、それを組み合わせて韻を踏ませたり、ラップっぽく聴こえたりするようなアルゴリズムを作って、16小節分くらいのラップのリリックを生成します。ラッパーの方がそのリリックを見られるようにして、実際にラップをしてもらうという仕組みになっていました。
- CD HATA :そんな音のプロダクトに多々携わられている土屋さんと共に、ここから先は今回のテーマである「いい音とは何か?」ということについてお話できたらと思っています。 みなさんは今までに「これいい音だな!」と思った経験は何かありますか?
- Otabe : 僕は昔札幌にいたんですけど、「PRECIOUS HALL」という有名なクラブがありまして、そこのスピーカーは低域もしっかりと鳴っていて割とフラットに色んな帯域が聴けるという、どちらかというとリスニング向きの箱なんですね。
そこでDJとかセレクターさんが1曲1曲を頭から終わりまで聴かせるような形で流してるいるんですけど、その体験がとても印象に残っています。なんだかすごく良い環境で音楽を聴いているな、という。普段は若者向けのクラブを中心に遊びに行っていので、初めての経験で衝撃を受けました。
- CD HATA : 本当にいい音で聴いていると目をつぶって聴いていると本当にその場で演奏されているような感じがしますよね。
- Otabe :
そうですね。結構全方位にスピーカーが置かれていて、マルチチャンネルではないんですが、2mixでもそういう風に聴こえるような音場が作られていて面白いです。
そして照明もかなり落とされているのでほぼ真っ暗なんです。だから視覚を遮られたような感覚でした。
- CD HATA : しかも写真とか一切撮っちゃ駄目ですよね。
- Otabe : そうなんですよ(笑)めちゃくちゃ厳しくて。
- CD HATA : でもそれだけ没入感というか、音に集中しよう!と思えますよね。
- Takahana : クラブの話を聞いて思い出したんですが、自分にも近い体験があります。ベルリンに行ったときにベルグハインに行ったんですよ。
- 土屋 : 入口が厳しいんですよね…(笑)
- Takahana : そうなんですよ!なんとか入れたんですけど、おそらくたまたま入れたのには理由があって、(行ったのが)平日の割と早い時間だったんですよ。
並んでても10~15人ぐらい。中に入ったらまだまだ全然ガラガラの状態なんですけど、だからこそなのかわからないけど、明かりがほとんどないんです。 遠方に遊びに行っている高揚感みたいなものももしかしたらあったのかもしれないんですけど、聴こえ方が全然違って。広い空間ならではの聴こえ方というか、ただ単に大きい音を出してるだけじゃないな、という印象が残っています。
- CD HATA : ドン、ドン、ドンっていうローの音圧で身体が鳴るから、踊ろうとか思わなくても強制的に身体がうなるというか、動いちゃうんですよね。なのに会話はできる。
- Takahana : そうなんですよね。ヨーロッパのクラブって割とそういうイメージなんですよ。音は大きいんだけど、音圧は上げすぎない。ちゃんと綺麗に音が出ているという印象がすごく強いですね。
- 土屋 : そもそもハウスミュージックって社交場で流れる音楽として設定されているので、話し声の帯域があまり被らないように設計されているらしいんですよ。めちゃくちゃ大きい音で鳴っていても普通に会話ができてしまうのはそういうことか。なるほど、と思ったことがあります。
- CD HATA : いい音といえば、ほかにどのようなことを考えてますか?
- 土屋 : (いい音って)録音技師さんの仕事みたいなところがありますよね。最近は家で仕事をする時間が長いので、音楽を流しながら仕事をすることも増えたんですけど、聴き流しやすいものを選びがちなんですよね。中でも最近ちょうどいいなと感じたのが、ビル・エヴァンスの”Live At The Village Vanguard”。
食器の音が入っていたり、ヴィレッジヴァンガードでのライブ音源なので、たまに地下鉄が通るとその音が入っていたりするんですよ。そういうものも含めてその空間の音が捉えられているというのも楽しみ方として面白いなと思いました。Hi-Fiでパラで録ったクリアな音が綺麗に定位が分かれていてパッケージングされているのもそれはそれでいいんですけれど、一発録りで、ともすればモノラルでも全然OKみたいなものもあるな、と最近気付きましたね。
- Otabe : 音楽以外の音が入ってるだけでいろんな感覚が刺激されますよね。例えば味覚だったりとか、嗅覚だったりとか、いろんな感覚が想起できたりするなと。
- 土屋 : 最近の研究だとクロスモーダル効果といって、なんだっけ、高い音を聞くと甘く感じたり、低い音を聞くと苦味を感じるみたいな、人間の味覚に多少音が影響してるということがわかったらしいです。それによって音楽とか何かを聴きながら何かを食べるとちょっと味が変わるみたいなこともあるかもしれないですね。
- CD HATA : お腹がいっぱいになってるときとお腹が減ってるときは聴こえ方が違うというのはあるような気がするんですよ。レコーディングとかをしていても、ご飯を食べる前に聴いていたものも、ご飯を食べてお腹がいっぱいになって聴くと「あれ?なんかちょっと悪いかな?」みたいな。
- 土屋 : うん、うん。あるかもしれない。耳の機能って血流量と結構関係があるらしくて、なので食べ物を食べたりして血の巡りが良くなると感度が高くなるというのが人間の生理現象としてあるので、(おなかがいっぱいな時は聴覚が)敏感になっている可能性はありますよね。
- Takahana : 夜にお酒を飲みながら曲を作って「これはいい曲ができた!」と思っていたのに次の日の朝に聴くとすごくダサく聴こえて全然駄目だ、というのはあったりしますよね。
- Otabe : お風呂で歌うと気持ちいい、というのも関係あるんですかね。リバーブの効果ももちろんあるとは思うんですけど。
- CD HATA : 確かにあるような気がする。自転車に乗ってたり身体を動かしていたりするときにメロディーが浮かんだりするし。
- 土屋 : 心拍数が上がると血流量も増えていいアイデアが浮かぶ、というのはあるのかもしれないですね。
- 土屋 : ちょっと「いい音とは?」という話題とは脱線しちゃいましたが…(笑)
- CD HATA : :脱線大歓迎なので(笑)サブタイトルにもありますが、みなさんはHi-FiとLo-Fi、どっちが好きですか?
- Takahana : あんまり好き嫌いで判断したことはないですね~…
- 土屋 : Lo-Fiの良さというのもあると思います。AMラジオが合う空間ってありますよね。あの、タクシーの中でAMラジオで「明日の天気」とかを聞くと、なんというかこう、こみ上げるようなものがあるじゃないですか。Lo-Fiならではの情緒のようなものがあるような気がします。
- CD HATA確かにそうですね。例えば、レコーディングの時に色々なマイクを立てても位相がずれちゃったり、ミックスの段階ではあれもいらない、これもいらない、となって結局少ない本数で済んじゃったり。情報量が多ければそれだけ良いものになるかというのは一概には言えないのかなと。
- Takahana : 質感の良し悪しとHi-FiかLo-Fiかはまた違う話なのかなと思っていて。情報量が多いことが決して悪いと言っているわけではないんですけど、昔のサンプラーでサンプリングして音を作るときに、1回サンプリングされることによって音が割れてそっちの方のが音の感じが良くなる!ということで、今でもわざわざサンプラーを1回通すことってあるじゃないですか。マスタリングの前に1回テープを通すこともあるし、それって情報量は事実として確実に落ちるのかもしれないですけど、直接音の質感や音の良し悪しには比例しないというか。情報量が多くてもLo-Fiな音ってあると思うんですよ。
- 土屋 : SP1200とかまさにそうですよね。あれでサンプリングするだけですごくLo-Fiなんだけど、音圧も上がるというか、ドンシャリという感じになりますよね。Hip-Hopの黎明期にみんな使っていたと思うんですけど。あれを主流とするみたいなマニアックな人たちもいるみたいですし、ちょっと独特ですよね。
最近のいわゆるLo-Fi Hip-Hopの人たちって、いい感じだからということでBOSSのSP202みたいな安い昔のサンプラーなどをあえて使うこともあるらしいです。 面白い現象ですよね。古い方が逆にいいんだ!みたいな。
- CD HATA : レコードってHi-Fi的なノイズが乗るとも言うじゃないですか。デジタルデータではカットされる帯域の音も乗っているとかいないとか。そう考えるとレコードって情報量は多いんでしょうか?
- 土屋 :
(レコードのようなアナログな音は)デジタルデータとそもそも原理が全く違うんですよね。デジタルデータの場合は量子化と言って一回データに落としちゃっているんですけど、レコードは振動を振動のままレコード(記録)しているじゃないですか。
原理的には多分、演奏しているときの空気の揺れがそのまま機械を通ってあの溝に刻み込まれていて、もう一度その溝をなぞるとその振動が再現されるという、ものすごい原始的な仕組みでできている。厳密には演奏した本当の場の空気がもう1回再現されるというものなんですけれど、デジタルデータは音声を音声データに変換してそれを再生する仕組みなのでまたちょっと違う。
記録方式と再生方式がアナログとデジタルでは全然違うので、「アナログは音が違う」という話って、なんだかんだ原理が全然違うからなのでは、という気がします。
- Takahana : なるほど。
- 土屋 : でもどうなんでしょうね。最近は楽曲制作のフロー自体がパソコンの中で完結するようになって、いわゆる「録音」という工程を挟まなくなっているのにも関わらずそれをアナログプレスをするとなると、演奏されている音にどういう違いが出るのか気になるところではありますね。
- Otabe : (レコードやカセットテープにあるのは)単純な「モノ」としての価値なのか…。レコードよりかはカセットテープにするとそれこそLo-Fiのいい質感が楽曲に落とし込めるような気がするんですけど…
- 土屋 : コンプがかかるんですよね。
- Otabe : そうですね。
- 土屋 : テープの話だと、聞いた話で面白かったのが、一時期テープがすごく流行った頃、レーベルに送られてくるデモが全部テープだったという時期があったらしくて。デジタルデータだとスキップできちゃうけど、テープだと流しっぱなしにして順番に聴くしかないからその方が聴いてもらえる、みたいなことがあったみたいなんですね。パッケージとしては面白いという。
- Takahana :
音の質感とは違うかもしれないですけど、家で普段何か仕事をしているときとかはそれこそサブスクで音楽を聴いたりしているんですけど、たまにサブスクじゃなくて自分の手持ちのレコードを聴こうと思うときってレコードをかけるじゃないですか。
そうすると、さっき土屋さんもおっしゃっていたような空気感とは少し違うのかもしれないんですけど、「これはもともとなのか?」というようなちょっとしたノイズが入っていたり、その曲と曲のあいだに「間」ができたりするんですよ。
それがなんとなく次の曲へのある種のアプローチとして、なんかめちゃめちゃいい間だなと思うときがたまにあって。あれが制限なのか、逆に自由なのかはわからないんですけど、音楽としての音質と実際の情報量の話とは違うけれど、Hi-Fiになって失われてしまった情報みたいなものも絶対にあるなと思いますね。
- 土屋 : ランダムアクセスが一瞬でできるようになったというのが(デジタルデータの)特性としてやっぱりあって、さっきのレコードの話ではないんですけど、最近スクラッチの世界大会でPCが解禁されたのでみんなデータで作り込んでくるんですよね。キューボタンとかめっちゃ使うんですよ。昔ながらのフェーダーとこすりでやるという感じではなくなってきていて。あれ?と思うこともありますけど。
- Takahana : 自分もそこはすごく違和感を感じました!
レコードの場合は音を記録している部分を直接触って操作するという感じじゃないですか。デジタルの場合はコントロールバイナルで操作する人はいっぱいいるんですけど、そうだとしてもキュー打ちを使っていて、そうすると本当に身体を使って何かを操作するというような楽器的な部分が失われてしまった感じがしたんです。いかにプリセットをうまく作るか、その球数がいくつあるのか、そのソフトウェアの数や使い方をどれだけ熟知しているかの勝負かのように見えてしまっていた時期があって。今となってはそれが当たり前になってしまったので、それはそれでまたちゃんとフィジカルと技術がないとできないな、というのも理解はしているんですけど、最初は結構違和感もありましたね。
- 土屋 :
どうでしょうね。フェティッシュに楽しむ側の視点からするとシミュレーションで全然いいと思うんです。だけど、アーティスト側のアプローチやノイズ、例えばギターのタッチノイズやピアノの打鍵音って、それはそれですごい良いものなんですよね。Hi-FiとかLo-Fiとか関係なく、アコースティック楽器ならではのどうしても出てしまう音にも非常に魅力がある。
シミュレーションの精度が上がっていくことによってわかることもたくさんあると思います。有名な話で言うと、写真の端に映っているポテトチップスの袋を引き伸ばして解析したら、周りでどんなことがあったか、どんな音が鳴っていたか復元できるという話があります。ほかにも、ビートルズの使われていない音源データを解析したら誰がどこでミスったのかわかる、みたいな話もあって(笑)
それと同じで、もしかしたらリマスタリングというか、元のアナログデータから超アップコンバートしたデータを抽出していって解析してみると、実はここで編集されているだとか、聴こえないけれど実際には何と言っているとか、そういう情報が読み取れるようになるかもしれないですね。
ヘンリー・デイヴィッド・ソローという作家が『ウォールデン』という話の中で、「森の向こうの街にある教会の鐘の音が森を通して聴こえるんだけれど、その鐘の音というのは森の無数の葉っぱの形が畳み込まれた鐘の音である」みたいなことを言っているんですよ。確かにその音が森の中を通ってくるということは、まさにコンボリューションという言葉の通りなのですが、たたみ込まれているはずなんですよね。多分(その鐘の音を)解析すると森の形が復元できるんじゃないかと思うんです。シミュレーションの解像度が上がっていくことで、将来的にそういうことも実現できるかもしれない。ノイズにこそ、もしかしたらそういう情報があるということも言えるのかもしれないなと。
- CD HATA : そこまでを表現に取り込むような新しい音楽が出てきたら、それは「いい音」というものにどう影響していくんでしょうか。
- 土屋 :
そうですね。今は録った音や響きを綺麗に整えてパッケージ化するという考え方で(音源が)作られていますよね。それが実際に演奏した場所、例えば教会とかの独特な響きの特性がある空間での演奏閉じ込めるというときに、演奏の音自体は綺麗にマイクで全部録るという前提なんですけど、冒頭にインパルスレスポンス音も収録する。パーンとサイン波が鳴って、その返り音が最初にだけ入っている、みたいな。
それを再生すると、そのインパルスレスポンスの響きがちゃんと復元されてその演奏した場所の音場を再現できるんじゃないかなと思うんです。
音源と響きが分離されることで、好きな響きで好きな物を聴くみたいなことが実現できるようになりそうだなと。
- Takahana :
実は普段、自分ではHi-Fiな環境で音楽を聴くことはあまりないんですよね。ハイレゾとか音にこだわった音源はいっぱい出てますけど、結局メディアにパッケージングされるときにHi-Fiだとしても、再生する側がそこに追いつけないとあまり良さが伝わらないのかな、と思っています。
そういう「いい音」を聴くことができる環境も作らないといけないんじゃないかな、とも感じました。
- CD HATA : やっぱりこの話は出口を見つけるのが難しいですね。名残惜しいですが、お時間ですので、今回はこのあたりでおしまいにしたいと思います。
土屋さん、この度はとても面白い話を聞かせていただき本当にありがとうございました。