Table of Contents
著者: 髙橋恒一
日付: 2025-12-25
Email: [email protected]
音楽とは、物理的な振動現象と、それを受け取る人間の認知システムとの間に生じる相互作用の劇である。
しかし、従来の音楽制作は、五線譜やピアノロールといった「記号のグリッド」に音を閉じ込め、このダイナミックな関係性を固定化してきた。作曲とは、無限に広がる音響空間から特定の点を選び取り、時間軸上に配列する行為となった。そこでは音は素材であり、人間の意志によって支配される客体であった。
Conchordal(コンコーダル)は、そうした既存の枠組みを解体し、直接認知結合(Direct Cognitive Coupling)の原理に基づいて、人間の聴覚認知メカニズムそのものをランドスケープとして仮想空間上に再構築する試みである。ここでは、音は配置されるものではなく、自律的なエージェントとして環境内を移動し、互いに干渉し合いながら調和を見つけ出す。これは、人間がコントロールする「作曲」から、システムが自ら美を生成する「創発」へのパラダイムシフトであり、音楽を静的な構造物から動的な生命現象へと還す挑戦である。
調和の探求: ピタゴラスから現代へ
古代より、人々は音の調和に普遍的な法則性を見出そうとしてきた。ピタゴラスは弦の長さの比率で音程が説明できることを発見し、音楽は完全に数学で記述可能であると考えた。ピタゴラス音律は、ある音の周波数を3倍し、オクターブ(2:1)で折り返して完全五度を得るという、2つの素数のみを用いた操作を繰り返すことで全ての音階を生成する。
しかし、ピタゴラスの信念とは裏腹に、ピタゴラス音律はこの世界の数学的不完全性を明らかにした。完全五度操作を12回繰り返してオクターブを一周しようとしても、導き出された音は元の音とは完全には一致せず、わずかに高い。この「ピタゴラス・コンマ」と呼ばれる不都合な微小差によって、純正な数比による音律は閉じた円環を作れず、調律上の矛盾が生じる。西洋音楽はこの問題に対し、「十二平均律」という妥協策で応えた。12個の完全五度をそれぞれわずかに狭め、誤差を均等に分散させることで矛盾を解消し、すべての調で転調可能な体系を手に入れた。これはひとつの勝利ではあったが、同時にすべての音程が純粋な整数比から離れることを意味し、美しいが不安定な純正律か安定だが濁った平均律かの二者択一を迫る不完全な解決でもあった。
18世紀、ラモーは『和声論』によって、それまで経験則の集積だった和声法を理論体系へと昇華させた。倍音という音響学的発見を踏まえ、協和音程と不協和音程を数比で定義しようと試み、長三和音を音楽の基礎とし、機能和声の概念を打ち立てた。7度の導音がもたらす不協和と緊張から主音への解決という構造は、バロックからロマン派以降の調性音楽全ての基礎となっている。しかし、ラモーの理論は長和音は説明出来ても短和音の説明は不完全だった。人間が何を「心地よい」と感じるのか、その根拠自体の完全な説明にはなっていない。ピタゴラス同様にラモーの理論も数学的不完全を内在しており、時代とともに聴衆の耳が慣れていくにつれ、和声進行に許される例外が無数に増え、主音への解決の遅延が際限なく進むという西洋音楽の歴史的構造を生む要因ともなった。
20世紀初頭、アルノルト・シェーンベルクの『浄夜 (Verklärte Nacht)』は、ワーグナー以降の「主和音への解決の遅延」を極限まで進めたロマン派的調性音楽の最終到達点の一つを示した。その後、彼は弦楽四重奏曲第2番の最終楽章において、ついに主音への帰結自体を放棄する。十二音技法では12の音すべてが平等となり、長らく音楽を支えてきた「主音への帰着」という重力場が失われた。これは以後の作曲家に巨大な自由を与えたが、同時に聴衆から音楽の重心を奪い去り、宙に漂うような無重力状態を生み出した。
メシアン、ブーレーズ、シュトックハウゼンらは、この流れをさらに急進させた。総音列主義では、音高だけでなく音価(リズム)、強弱、音色といった要素までもが厳格な数理的音列によって統制される。この徹底した合理主義は音楽言語を前人未踏の領域へ押し広げたが、その結果生まれた作品は極度に抽象化され、逆説的にも聴衆には「ランダムなノイズ」として知覚されることが多かった。人間の聴覚認知における時間分解能やパターン認識能力は、音高の微細な変化とリズムの数理的な操作を同じ解像度では処理できないからである。
これと真逆の方向性として、クセナキスは物理学的確率論を、ケージは偶然性をそれぞれ音楽に導入し、決定論的制御からの脱却を図った。しかし、いずれにしても、「人間の耳が音をどう渇望し、どう解決を期待するか」という認知的な報酬系は、構造の背後に追いやられ続けた。20世紀後半になっても聴衆は依然として古典的な調性作品を求め、現代音楽と聴衆の乖離は決定的となった。「和声とは何か」という根源的な問いへの答えが見つからないまま、20世紀後半以降の多くの作曲家たちは、シュニトケやペルトのように調性的要素を部分的に復活させたり、過去の様式を引用・コラージュするポストモダン的な折衷主義へと向かった。音楽理論の地平には、依然として霧が立ち込めていた。
この停滞を打破する鍵は、記号化された音符ではなく、音そのものの物理的構造の中に潜んでいるのではないか。こう考えた一群の作曲家たちが1970年代にフランスで興った。グリゼーやミュライユらスペクトル楽派は、音響を物理的な波形として捉え、その倍音スペクトルを分析・合成することで作曲する手法を追求した。和声を伝統的な機能や音階からではなく、人間の耳が実際に受け取る音響物理学的な事実から立ち上げようとする試みは、従来の調性的文法から解放されつつも、物理的・生理的な根拠に支えられた説得力のある新しい響きを持っていた。
一方、武満徹は、西洋近代の音楽観とは異なる角度から新たな響きの地平を切り拓いた。武満は自身の到達点を「調性の海」と表現し、「汎調性」という概念を語っている。それは「一音がすべての世界を含み、全ての音が有機的に絡み合った状態」であり、単なる無秩序ではなく、宇宙的な秩序を内包した混沌である。調性も無調も包括したこの発想は、彼の音楽において和声が局所的な機能進行ではなく、大きな「響きの場」として感じられることに通じる。彼は西洋の機能和声を否定しつつも、「音そのものが引き合う力(音の重力)」を信じていたと言えるだろう。
21世紀に入り、新たな創造の担い手として台頭したのがAIによる生成モデルである。大規模な音楽データセットで訓練された機械学習モデルは、人間が作ったかのような楽曲を自動生成できるようになった。これは一見、創造性の民主化のようにも思えるが、本質的な課題が横たわっている。現在のAIは主に過去のデータから統計的な頻出パターンを抽出・模倣する。そのため、生成される音楽は過去の作品の焼き直しや組み合わせに留まりやすく、様式的な新規性や、なぜその音が選ばれたのかという「必然性」が希薄である。ここでは和声法や対位法、ジャズのモードなどの明確な創造原理が不在であり、20世紀に露呈した「調性喪失後の音の根拠」という課題に答えるものではない。
Conchordalによる直接認知結合
Conchordalは、音楽と和声の根源を覆う霧を払い、新しい道を指し示す試みである。
Conchordalの本質は、「人間の認知ランドスケープ上で直接音響を生成する」ことにある。これは音楽制作における新たなパラダイムであり、コンピュータによる音響生成プロセスと人間の聴覚認知メカニズムとを直接リンクさせる直接認知結合(Direct Cognitive Coupling) の原理を中核に据えた具体的実装である。
直接認知結合とは、音符や音階のような記号的媒介を経由せず、音響生成を人間の聴覚認知構造に直接根差させる原理である。従来の作曲が記号から音への変換過程を経るのに対し、認知的ポテンシャル場そのものが音の生成環境となる。
この原理は、本来、音響生成と聴覚認知との双方向的な連動を志向する。現在のConchordalは、その第一段階として、認知モデルから音響環境への写像を実装している。将来的には、聴取者の生体信号(脳波、心拍、皮膚電気反応等)をリアルタイムでシステムへフィードバックし、聴く者の内的状態に応じて音楽が変容し、その音楽がさらに聴く者を変容させる閉ループを実現することを目指す。
この閉ループが実現するとき、作曲家・演奏家・聴衆という役割区分は溶解する。シナリオを設計する者、系に身体的に参入する者、聴取を通じて共振する者。これらは排他的な役割ではなく、参与の度合いのグラデーションとなる。聴衆が演奏家となり、演奏家が作曲に介入し、作曲家自身が系の内部に棲まう。音楽は「誰かが作り、誰かが演じ、誰かが聴く」という固定的で一方向の流れから解放され、「共に棲まい、共に生成する」現象へと変容する。
音楽の認知的ランドスケープ
Conchordalの基盤となる「ランドスケープ」は、人間の聴覚認知特性を模したポテンシャル場である。従来の作曲が格子状の音階や固定された音符に音を当てはめるのに対し、Conchordalは人間の聴覚生理そのものを仮想環境として再現する。システムは現在発生している音響信号をリアルタイムで解析し、周波数軸と時間軸の二次元でこの内的地形を構築する。
周波数軸: ピッチと和声の地形
内耳蝸牛の物理構造を模し、2を底とする対数尺度上にトノトピー(周波数地図)を展開する。この軸上で、以下のポテンシャルが生理学・認知心理学の知見に基づきリアルタイムに計算される。
-
ラフネス (Roughness) 蝸牛基底膜上の臨界帯域における振幅干渉に対応する。Plomp-Leveltモデルに基づき、近接した周波数成分間のうなりがもたらす生理的不協和度を定量化する。値が高いほど、その周波数領域は音響的に「粗さ」がある。
-
ハーモニシティ (Harmonicity) 蝸牛神経核から下丘にかけての神経発火における位相同期、すなわち時間微細構造の規則性に対応する。音響成分が整数比の倍音列として脳に統合されやすいかどうか、つまり知覚的な「融合」の度合いを示す。
-
コンソナンス (Consonance) ラフネスとハーモニシティを統合して得られる総合的な協和適応度。ランドスケープ上の各地点における音の生存しやすさを表し、エージェントが目指すべき「調和」の頂となる。
時間軸: リズムとグルーヴの地形
音楽認知は脳内の神経振動と深く結びついている。Conchordalは周波数軸ランドスケープの時間的推移を解析し、脳波モデルに基づく四階層の周期構造をリアルタイムで抽出する。音のエージェントはこれらの周期と同調することで、外部から与えられた拍子ではなく、自発的に有機的なリズムを形成する。
-
デルタ帯域 (~0.5–4 Hz) 楽曲全体を貫く緩やかなパルス。拍節構造や大局的なフレージング(楽句の呼吸)を司る。
-
シータ帯域 (~4–8 Hz) 音のアーティキュレーション、音節単位のまとまりの形成に寄与する。個々の音事象の輪郭を刻む層。
-
アルファ帯域 (~8–13 Hz) フレーズ内部の拍動やアクセントのパターンを形作る。リズムの骨格となる中間層。
-
ベータ帯域 (~13–30 Hz) グルーヴ感、複数音の同期精度(マイクロタイミング)を制御する。時間的な「揺らぎ」と「鋭さ」が共存する最も細かい層。
このように構成されたランドスケープは、現時点の心理音響学・神経科学の知見に基づいている。しかし、これは固定された普遍的真理として提示されるものではない。音楽の知覚は文化・時代・個人によって異なり、「協和」の意味もまた多様である。Conchordalのランドスケープはパラメータとして可変であり、異なる文化圏の音律体系、個人の聴覚特性、あるいは未知の知覚原理を組み込む余地を持つ。これは特定の美学を強制するシステムではなく、認知と音響の直接的結合という原理を探求するための開かれた基盤である。
音響生命の創発
仮に一つのランドスケープを特定したとしても、それが示唆する音楽は一つではない。同じ地形から、あるパラメータ設定ではモーツァルト的な均整が、別の設定ではパンクロック的な衝動が導き出されるかもしれない。ランドスケープは可能性の空間であり、その探索には何らかの「住人」が必要となる。Conchordalは、この住人として人工生命(ALife)的なエージェントを採用する。
-
個体 (Individual) ランドスケープ上で活動する基本単位。各個体は自律的な音響シンセサイザーであり、周囲のポテンシャル勾配を知覚し、時間軸上の神経リズムに同調し、エネルギーを消費しながら生存する。個体は協和度の高い領域を求めて周波数空間を移動し、不協和な領域では急速に消耗する。中央集権的な指揮者は存在しない。全ては局所的な知覚と反応によって決定される。
-
ポピュレーション (Population) 複数の個体が形成する音響の群集。個体は互いに干渉し、競合を避けてニッチを分化させるか、倍音関係にある領域で共生的に融合する。群集の密度はランドスケープ自体を動的に変形させ、環境と住人は相互に規定し合う。ポピュレーションは単なる個体の総和ではなく、集団としての創発的性質を持つ。
こうして、個体の局所的行動から、和声、旋律、リズムといった音楽的構造がボトムアップに創発する。作曲者が音符を配置するのではなく、音響生態系の力学が音楽を生み出すのである。
シナリオ: 時間に形を与える
音楽とは、無限に続く均一な物理的時間を、始まりと終わりを持つ有限な持続として切り取り、そしてそこに緊張と解放、上昇と下降、クライマックスと静寂といった構造をもたらす行為である。Conchordalにおいて、マイクロなレベルでの調和やリズムは自律的に創発するが、この時間的構造、つまり作品をひとつの体験として成立させる弧、は人間の創作者によってデザインされる。作曲者は音符を一つ一つ配置するマイクロマネージャーではなく、生態系の演出家として振る舞う。
この演出のための道具が時間軸に沿って生態系の環境条件を変化させる指示書である「シナリオ」である。創作者は個々の音を指定するのではなく、系全体の状態遷移を記述する。ランドスケープの地形を変形させ、個体群の生成と消滅を制御し、リズム層の強調を移り変わらせる。これらの操作を通じて、創作者は混沌から秩序へ、あるいは静寂から飽和へといった巨視的な軌道を描くことができる。
直接認知結合の射程
Conchordalで示した直接認知結合の原理は、音楽固有のものではない。人間の感覚や認知が本来的に持つ美的評価軸をランドスケープとしてモデル化し、その中で創造的要素が自律活動するというパラダイムは、あらゆる芸術領域へ一般化し得る普遍性を秘めている。
-
視覚芸術 光の波長と強度という物理現象を、人間の視覚系がどう処理するか。網膜の錐体細胞による色彩分解、一次視覚野のエッジ検出、四次視覚野の色知覚、頭頂葉における空間統合などの階層構造がランドスケープの基盤となる。色相・明度・彩度の均衡、構図における重心と緊張がポテンシャル場を形成し、視覚要素のエージェントは補色関係によるコントラスト(視覚的ラフネス)や対称性による安定度を感じ取りながらキャンバス上を移動する。
-
文学・物語 物語における調和、すなわち構成の均衡、伏線と回収、緊張と緩和の波を認知モデル化する。前頭前皮質によるワーキングメモリ、海馬を介した文脈の時間的統合、そして予測符号化による期待と逸脱の処理が、物語認知のランドスケープを形成する。キャラクター、プロット要素、主題をエージェントとし、意味ネットワークや感情曲線のランドスケープ上を移動させる。
-
建築・空間デザイン 人間が快適と感じる空間比率、動線の流れ、構造的安定性をランドスケープ化する。前庭系による平衡感覚、海馬の場所細胞と嗅内皮質のグリッド細胞による空間認知、そして固有受容感覚を通じた身体と環境の関係性が、建築ランドスケープの生理的基盤となる。建築要素をエージェントとし、物理法則と美的・人間工学的基準の双方から導かれるポテンシャルに従って自己組織化させる。
いずれの領域においても核心は同じである。人間の五感と認知が長い進化の過程で培ってきた評価基準を、AIの学習データとして表層的に模倣するのではなく、第一原理(First Principles)としてシステムに組み込む。創造物は、統計的な頻出パターンの再生産ではなく、認知的な必然性を持って立ち現れる。
終わりに
本マニフェストは、失われた音楽の重力を取り戻し、新たな創造の地平を拓くための宣言である。
ピタゴラス以来、人類は調和の原理を数の中に求めてきた。しかし、純正な比率も、平均律の妥協も、調性の放棄も、生成AIの模倣も、「なぜその音でなければならないか」という問いには答えられなかった。
我々は今、原点に立ち返る。調和の原理は抽象的な数式の中だけにあるのではない。それは物理現象の中に、そしてそれを受け取る人間の耳と脳の中にこそ宿っている。Conchordalは、この事実を工学的に体現する試みである。ここでは音はもはや記号ではなく、自律的に振る舞う存在だ。音の生態系と人間の知覚という大地とが直接結びつき、機械と人間の真の共創が始まる。音楽は固定された録音物から、「生きた現象」へと還る。
「Conchordal」という名称には複数の響きが重なる。調和を意味する concord、和声を示す chordal、内耳の蝸牛を想起させる conch、そして珊瑚の coral。珊瑚礁が無数のポリプの自律的な営みから創発するように、Conchordalの音楽は個々のエージェントの局所的行動から立ち現れる。その調和は、人間の聴覚器官である巻貝状の蝸牛に直接根差している。
我々はConchordalを、調和消失後の現代音楽への一つの回答として、世に提示する。これは新しい芸術形態であると同時に、「人間とは何か」「創造とは何か」という根源的問いへの、一つの解答である。