The Road to Next Gen Ludens

PlayStation, PSVR, ゲームなど興味のあるモノコト。

オンラインインタビュー全文日本語訳 「明らかになったPS5: マーク・サーニーの技術に深く踏み込む ~サーニー・コンピュータ・エンタテインメント~」 Digital Foundry

f:id:keepitreal:20200405141709j:plain

オンラインインタビュー「明らかになったPS5: マーク・サーニーの技術に深く踏み込む ~サーニー・コンピュータ・エンタテインメント~ 次世代を設計する」 

リチャード・リードベター (Richard Leadbetter, デジタルファウンドリ Digital Foundry/Eurogamer テクノロジーエディター)

2020年4月2日

 

3月18日、ソニーはついにPlayStation 5の技術的な構成について詳細な情報を発表した。

リード・システムアーキテクトであるマーク・サーニー氏は、これまでに議論されてきたトピックを大幅に拡張し、システムのコアスペックに関する多くの新情報を明らかにした。――PlayStation5の中核的基盤、つまりパワー、帯域幅、スピード、そして没入感を中心とした、開発者中心のプレゼンテーションを行ったのである。

本番の数日前、Digital Foundryはサーニー氏から、この講演で取り上げられるトピックについて詳細を聞いた。

(編者注:長い記事でもあり、地の文とマーク・サーニー自身の発言とをより明確に区別するため、これ以降のサーニーの言説は「」内に太字で表しました)

その内容の一部は当初の取材(編者注:第一回目の記事)でも伝えた通りだが、さらに多くの情報が入ってきている。

しかし、ここではっきりさせておきたいのは、この記事のすべてはサーニーの議論のトピック中心に書かれていることだ。今回の記事で多くのことを学ぶ必要があるが、PlayStation 5の戦略については、これ以上の情報は得られないだろうし、訊ねたいとも思わない。

2016年に開かれた前回のミーティング(編者注:PS4 Proを発表したPlayStation Meeting)でサーニーは、ソニーがどれだけコンソール世代というコンセプトに執着しており、そしてハードウェアがそれを証明しているのか、ということを詳しく話していた。

では、クロスジェネレーションのゲーム開発は、ファーストパーティーの開発者にとって重要なのだろうか。彼は(PCスタイルの漸進的なイノベーションとは対照的な)コンソール世代のコンセプトには全面的に賛成だとあらためて強調しつつも、ソフトウェア戦略については語らなかった。公平を期すために言えば、彼の領域ではなかったからだ。

サーニーはまた、2013年にPlayStation 4を発表したが、それを「スーパーチャージドPCアーキテクチャ」と定義した。開発者にとって使いやすい、マルチプラットフォームの黄金時代をもたらしたアプローチだったのだ……しかしPlayStation 5は、前世代のゲーム機で見られたような、より「エキゾチック」な哲学への回帰なのだろうか? 

サーニーは、PS5の設計はPlayStation 4の開発者にとって扱いやすい、という点以外ほとんど情報を明かしていないが、新しいシステムの機能をさらに深く掘り下げてみると、PS5の設計には、PCでは実現できない多くの側面があるのだ。

一方で、彼の開発者向け講演で取り上げられたトピックをさらに深く掘り下げていくと、マーク・サーニーは生き生きとした表情を見せてくれた。そこには、彼が開発に貢献したハードウェアへの確かな本物の情熱と熱意があり、この記事で最大限の価値を得ることができる。当オンラインミーティングでは、多様なトピックを取り上げている。

PlayStation 5の革新的なブーストクロック(周波数の引き上げ)――実際にはどのように機能するのか?
後方互換性を実現するために、CPUの観点からは何が必要だったのか?
SSDの決定的な利点は何なのか、そしてそれをどのように実現しているのか?
◆3Dオーディオは、実際にどのように機能するのか?
◆新しい3Dオーディオシステムは、TVスピーカーや5.1/7.1サラウンドシステムとどのように連携するのか?

これ以降、技術的側面での深い話になることは間違いない。プレゼンテーションで提起されたトピックのいくつかを、より深く掘り下げる機会である。会話の中で何度かサーニーがさらなる調査を提案してくれたが、これは我々がイベント終了後、すぐに話を聞きに行けなかった(実際、出来なかった)ことが理由の一つだ。言うまでもないが、もしまだ視聴されていない場合、マークのプレゼンテーションの一部始終をご覧になることを強くお勧めする。ここから(編者注:動画リンク)

 

PlayStation 5のブーストクロックとその仕組み

私が特に興味を持った分野の1つはPlayStation 5のブーストクロック――これは、冷却アッセンブリの熱放散量に基いてチップ上のシステムに供給電力量を設定するという技術革新だ。

興味深いことに、マーク・サーニーはプレゼンテーションの中で、PlayStation 4の冷却の難しさを認め、最大供給電力を設定することで、実際の作業は楽になることを示唆した。

「未知数はなくなりました。最悪の場合のゲームの消費電力を推測する必要はありません」とサーニーは講演で述べた。

「冷却ソリューションの詳細については、ティアダウン(編者注:ゲーム機を一通り分解して紹介すること)のために取っておきますが、エンジニアリングチームが考え出したものに満足してもらえると思います」

いずれにせよ、SoCには設定された電力レベルがあるというのが事実だ。携帯電話やタブレット、あるいはPCのCPUやGPUであれ、周波数を上げること(ブーストクロック)は、歴史的に次から次へとパフォーマンスを変化させてきたのだが、これはコンソールでは起こり得ないことだった。

PS5は、となりのPS5より遅くも速くも動作しない。開発上の課題だけでも、控えめに言っても大変である。

「ダイの実際の温度は用いません。異なるPS5の間で2種類のばらつきが生じるからです」マーク・サーニーは説明する。

「1つは周囲の温度の違いで起こる変動で、コンソールは部屋の中で高温になったり低温になったりします。

もう1つは、コンソールに搭載されている個々のカスタムチップに起因する差異で、チップによっては高温で動作したり、低温で動作したりします。

したがって、ダイの温度ではなく、CPUとGPUの動作情報に基づいて周波数を決定するアルゴリズムを使用します。これにより、異なるPS5の間で一貫した動作が保たれます」

プロセッサの内部には電源制御ユニットがあり、CPU、GPU、メモリインターフェイスの動作を常に測定し、実行中のタスクの性質を評価する。

特定のPS5プロセッサの性質に基づいて消費電力を判断するのではなく、より普遍的な「モデルSoC」を使う。これは、プロセッサがどのような動作をするかシミュレーションしたもので、いずれのPlayStation 5の電源モニターの中心部にも同じシミュレーションが使用されており、すべてのユニットで一貫性を確保できる。

「PS5の動作は全て同じです」とサーニーは言う。

「同じゲームをプレイし、同じ場所に行くのであれば、カスタムチップの種類やトランジスタの種類は無関係です。ステレオキャビネットに入れても、冷蔵庫に入れても構いません。

CPUとGPUの周波数は、他のPS5と同じです」

開発者からのフィードバックによれば、彼らが問題を抱えているのは2つの領域だという。

1つは、全てのPS5が同じように動作するわけではないという概念で、これには「モデルSoC」の概念で対処する。

第2の領域はブーストの性質である。周波数が一定時間ピークを迎えた後、再び減速するのだろうか?スマートフォンのブースト機能はこのように動作する傾向がある。

「『時定数』はCPUとGPUが動作に要する周波数に到達するまでの時間であり、開発者にはとても重要です」とサーニーは付け加えた。

「それは非常に短い時間であり、もしゲームが数フレームの間、電力を大量消費する処理を行っている場合には、抑制が行われます。

数秒あるいは数分間、ずっと特別なパフォーマンスを発揮して、その後システムが制限される、などという時間差はありません。そんな環境は開発者は望んでいないのです。

私たちはPS5が、消費電力に非常に敏感であることを確認します。

加えて開発者は、CPUとGPUが使っている電力量について、正確なフィードバックが得られるのです」

マーク・サーニーは、開発者がゲームエンジンを別の方法で最適化し、特定の電力レベルで最適な性能を達成する時代が来ると考えている。

「最適化の際には、電力が重要な役割を果たします。

最適化して同じ電力を維持すれば、最適化のメリットを全て享受できます。

最適化して電力を増やせば、パフォーマンスが少し戻ります。

最も興味深いのが消費電力の最適化です。絶対性能が同じで、しかも電力が削減されるようにコードを変更できれば、それは勝利です」

要するに、開発者が違うやり方で最適化を学ぶ――GPUからは同じ成果を引き出しつつ、消費電力を最適化することでクロック周波数を増大させ、さらに処理速度を上げることができる、ということだ。

「CPUとGPUには個別の供給電力量がありますが、もちろんGPUは大きい方です」とサーニーは付け加えた。

「CPUへの供給電力が使用されない場合 (例えば3.5GHzが上限など)、未使用の電力はGPUに割り当てられます。これは、AMDがSmartShiftと呼んでいるものです。

CPUとGPUの両方が、上限である3.5GHzと2.23GHzで動作するのに十分な電力があるので、開発者がどちらかをより低速で動作させる必要はないのです」

「Race-to-idle(レース・トゥ・アイドル 編者注:チップがタスク完了後、速やかに低電力に回帰すること)と呼ばれるもう一つの現象があります。

30Hzで動作中、33ms(ミリ秒、1000分の1秒)の割当のうち28msを使用していると想定すると、GPUは5msの間、アイドル状態になります。

電力制御ロジックは、低電力の消費を検出して――結局GPUはその5ms、あまり動作していません――周波数を上げるべきであると結論付けます。

しかしこれは無意味なクロック周波数の上昇です」マーク・サーニーは説明する。

f:id:keepitreal:20200405165147p:plain

この時点で、クロックが速くなったとしてもGPUは何もしていない。(仕事がないのに)周波数を上げても全く意味がないのだ。

「その結果、GPUはそれ以上仕事せず、代わりに割り当てられた作業をより迅速に処理した後、V-Sync(垂直同期)などを待っているだけになり、より長い間アイドル状態になってしまいます。

私たちは、GPU周波数の無意味な増加を表現するために『レース・トゥ・アイドル』と呼んでいます」とサーニーは説明する。

「可変周波数システムを構築すれば、この現象(CPU側にも同様の現象があります)を踏まえた上で、通常、周波数は最大値で固定されていることがわかります!

しかしこれは、そう上手い言い方でもありません。GPUの動作周波数について有意義なことを言うならば、ゲーム中、33.3msのフレームのうち33.3msの間、GPUがフルに使われる場面を探し出す必要があるわけです」

「つまり、GPUはほとんどの時間を最大周波数かそれに近い周波数で費やす――『レース・トゥ・アイドル』を気にすることなく――という私の発言は、フレーム全体が生産的に使われているシチュエーションにおける、PlayStation 5のゲームを想定していたのです。

CPUについても同様であり、フレーム全体で使用率が高いシチュエーションを調査した結果、CPUはほとんどの時間を最大周波数で動作すると結論づけました」

簡単に言えば、レース・トゥ・アイドルを排除してCPUとGPU両方をフルに使用した場合、ブーストクロックシステムでは、両方のコンポーネントが最大周波数付近または最大周波数で動作するはずだ。

サーニーはまた、消費電力とクロック速度の関係は直線ではないことも強調した。周波数を10%下げると、消費電力は約27%減少するのだ。

「一般的には、10%の電力削減は周波数の数%の削減にすぎません」とサーニーは力説した。

これは革新的なアプローチであり、注がれた技術的努力はおそらく相当なものであるが、マーク・サーニーは簡潔に要約した。

「私たちのブレークスルーの一つは、ホットスポット(CPUとGPUの熱密度)が同じである一連の周波数を見つけることでした。

そしてそれをやり遂げました。冷却しやすいとも、冷却しづらいとも言えるわけです」

ブーストがゲームデザインにどのような影響を与えるかについては、今後、さらに明らかになっていくだろう。Digital Foundryが話を聞いた数人の開発者は、現在のPS5の作業では、グラフィックスコアのクロックを2.23GHzに維持するため、CPUを抑制していると見ている。現在、ほとんどのゲームエンジンは低性能のJaguarを念頭に置き設計されているため、これは完全に理にかなっている――たとえスループットが2倍になったとしても(換言すれば60fps対30fpsだ)、PS5のZen2 コアにはほとんど負担がかからない。ただしこれはブースト・ソリューションではなく、Nintendo Switchで見たものと同様のパフォーマンス・プロファイルだ。

「固定プロファイルについては開発キットで対応しており、最適化を行う際、可変クロックを持たないようにすると便利です。

発売されるPS5ゲームでは、常に周波数がブーストされているため、さらなる電力を活用できます」とサーニーは説明する。

f:id:keepitreal:20200405160214p:plain

ブースト周波数は、フルフレームの演算負荷で維持するよう設計されており(上図のような場合が想定される)、GPUの仕事量が少ないときにだけ上昇するものとは対照的だ(下図のような状況)

f:id:keepitreal:20200405162205p:plain

しかし、開発者がPlayStation5の消費電力の上限に合わせて最適化するつもりがなければ、どうなるのだろうか?私は開発者が回避できる「最悪のシナリオ」の周波数――つまりPCコンポーネントのベースクロックに相当する周波数――があるのかどうか疑問に思った。

「開発者はどんな最適化もしなくてよいのです。

必要に応じて、CPUとGPUが実行している動作に合わせて、周波数が調整されます」マーク・サーニーは反論する。

「それはCPUとGPUの全トランジスタ(あるいは可能な限りの最大数)が、1サイクルごとにオンになるよう意図的に書かれたコードがあったらどうなるか、という疑問だと思います。

かなり抽象的な質問ですし、ゲームはその程度の消費電力ではありません。実際、このようなコードを既存のゲーム機で実行したら、消費電力は意図した動作範囲から大幅に超過し、ゲーム機がサーマルシャットダウン(過熱保護機能)する可能性さえあります。

PS5は、このような非現実的なコードをより優雅に処理するでしょう」

現時点では、ブーストとクロックの変動する幅についてはまだ把握が難しい段階だ。

また、後方互換性についても混乱が生じており、サーニーがPS5で上位100のPlayStation 4ゲームを動かしてパフォーマンスを向上させると語ったことが、発売時には比較的少数のタイトルしか動作しない、と誤解されていた。

これは数日後に明確にされた(何千ものゲームが動くことを期待する)ものの、PlayStation 5の後方互換性の性質には魅力的なものがある。

PlayStation 4 Proは、4Kディスプレイ対応へ道を開くため、ベースモデルよりも高いパフォーマンスを発揮するよう設計されたが、互換性が鍵を握っていた。

「バタフライ(蝶)」GPU構成が導入され、実質的にグラフィックスコアは倍増したが、クロック速度はともかく、CPUは同じものである必要があった――Zenコアは選択肢に無かったのだ。

PS5では、RDNA2 GPUにロジックが追加されPS4およびPS4 Proとの互換性が確保されているが、CPU側はどうだろうか?

Jaguar CPU用に作成されたゲームロジックは全て、Zen2 CPUで正常に動作しますが、命令の実行タイミングが大幅に異なる場合があります」マーク・サーニーは言う。

「私たちはAMDに協力し、Zen2コアを特別仕様にカスタマイズしました。

これらのコアには、Jaguarのタイミングに近似したモードがあります。

私たちは、いわば、後方互換性の作業を進めながら、それを後ろのポケットに入れているのです」

 

プロプライエタリ(独自仕様)のSSD――どのように動作し、何をもたらすのか

PlayStation 5が『WIRED』で初披露されて以来、ソニーSSDの伝道に多くの時間を費やしてきた――ロード時間の短縮のみならず、ゲームをより大きくし、世界をより詳細にし、はるかに動的なメモリの使用をする点で変革をもたらすであろう、ソリッド・ステート・ストレージ ソリューションだ。

1秒で5.5GBという驚異的な非圧縮時の帯域幅に加え、ハードウェアによる高速デコード(有効帯域幅を約8~9GB/sに拡大)を実現したPlayStation 5のSSDは、マーク・サーニーと彼のチームの誇りであることは間違いない。

低レベルと高レベルのアクセスがあり、ゲームメーカーは好きなものを選べる――しかし開発者が新しいハードウェアの超高速を利用できるのは、新しいI/O APIのおかげだ。

ファイル名とパスの概念は廃止され、必要なデータの場所をシステムに可能な限り速く伝えるIDベースのシステムに移行した。開発者はIDと、開始位置、終了位置を指定するだけで、数ミリ秒後にデータが転送される。2つのコマンド・リストがハードウェアに送られる。

1つはIDのリスト、もう1つはメモリ割り当てと解除が中心で、つまり、メモリが新しいデータ用に解放されることを確認する。

わずか数ミリ秒の遅延で、1フレームの処理時間内、また最悪の場合は次フレームの処理時間内にデータをリクエストし転送できる。これは、同じ処理に通常250ms必要なハードドライブとは全く対照的だ。

これが意味するところは、コンソールではデータを非常に異なる手法で処理できるため、より効率的であるということだ。

「今もゲームに取り組んでいます。私は『Marvel's Spider-Man(マーベル・スパイダーマン)』『Death Stranding(デス・ストランディング)』『The Last Guardian(人喰いの大鷲トリコ)』のプロデューサーでした」マーク・サーニーは言う。

「私の仕事には創造的な問題と技術的な問題が混在していたので、システムが実際にどのように機能しているか、多くの洞察を得られたのです」

最大の問題の一つは、ハードディスクからデータを取得するのにかかる時間と、それが開発者に何を意味するのか、ということだ。

「例えば、敵が死に際に、何か怒鳴ったとします。

これは、緊急事態における緊急のリクエストとして送信できますが、他のすべてのゲーム内容や操作リクエストがパイプラインにあるため、データが返されるまでに250msかかる可能性があります」とサーニーは説明する。

「250msという時間が問題なのは、敵が死ぬときに何かを叫ぶとすれば、それはほぼ瞬時に起きなければならないからです。

この種の問題は、PlayStation 4とその世代で大量のデータをRAMに格納する原因となっています」

f:id:keepitreal:20200405165226p:plain

つまり緊急のデータに即座にアクセスするには、現行世代のコンソールではRAMにさらに多くデータを保存する必要があるが、次世代においては大幅な効率化への扉を開くことになる。

SSDは、コンソールが"必要とする可能性があるが必須ではない大量のデータ"をキャッシュするのではなく、必要に応じデータをリクエストできるため、負担を大きく軽減する。データのコピーが不要になるため、効率性がさらに向上する。

ハードドライブの遅延の多くは、機械のヘッドがドライブプラッタの表面を動き回るのが原因だ。

データの検索には、データを読み取るのと同じかそれ以上の時間がかかるときがある。

そのため、データの検索(あるいは「シークする(走査する)」)に時間を費やすのではなく、データの読み込みにドライブが専念できるようにするため、同じデータが何百回もコピーされることが頻繁にあるのだ。

「『Marvel's Spider-Man』はブロック戦略(編者注:街区ごとに全データをグループ化する手法)の好例です。

約1000ブロックについて、高いLOD(Level of Detail 編者注:カメラ距離ごとに描画モデルを切り替える手法)と低いLOD表現があります。

何かが頻繁に使われる場合は、それらがデータの中に大量に存在することになります」とサーニーは言う。

コピーをしなければ、ドライブのパフォーマンスは床を突き破るように落ちてしまう。

サーニーが調べたあるゲームの例では、50MB/s~100MB/sを目標としていたデータ・スループットが8MB/sまで低下した。

データのコピーはスループットを大幅に向上させる、しかし当然、ドライブ上の無駄な領域も大量に発生させるのだ。

『Marvel's Spider-Man』のためにInsomniac社はエレガントな解決策を考え出した訳だが、またしてもRAMの使用に大きく依存していたのである。

「テレメトリ(編者注:遠隔的なゲーム情報の測定手法)は、このようなシステム上の問題の特定に不可欠です。

たとえば、都市のデータベースのサイズが一晩で1GBも跳ね上がったとします。

原因は1.6 MBのゴミ袋 (これは特別大きなアセットではありません) だとわかりましたが、ゴミ袋は600の街区全てに存在したのです」マーク・サーニーは説明する。

「Insomniacのルールでは、400回以上使用されるアセットはRAMに常駐させることになっていたので、ゴミ袋はそこに移されましたが、明らかにRAMに常駐できるアセットの数には制限があります」

これは、SSDが次世代タイトルにどれだけの変革をもたらすかを示すもう1つの例だ。コピーが要らないことで、ゲームのインストールサイズがより最適化される。

こういったゴミ袋はSSD上に一個だけあればよく、何百も何千も存在する必要はない。そしてRAMに常駐する必要もない。

ゴミ袋は数桁も高速なレイテンシと転送速度でロードされる。つまりキャッシュを削減したデータ転送への「ジャスト・イン・タイム(必要なものを、必要なだけ、必要な時につくる)」アプローチだ。

その陰では、SSD専用の圧縮ブロック 「Kraken」 、DMAコントローラ、コヒーレンシーエンジンおよびI/Oコプロセッサの働きにより、ソリッド・ステート ソリューションを最大限に活用するためのカスタムコードを必要とせず、開発者はSSDの速度を簡単に活用できるのだ。

フラッシュ・コントローラへ多額のシリコン投資をすることで、最高のパフォーマンスが保証される。開発者は新しいAPIを使用するだけでいい。

これは即効性が期待でき、開発者の大規模な賛同を必要としない、優れたテクノロジーの一例である。

 

3Dオーディオ――テンペストエンジンのパワー

ソニーの3Dオーディオへの取り組みは、かつてないほど壮大かつ野心的だ。

簡単に言えば、PlayStation 5は、これまでゲーム業界で見られたものよりはるかに優れたサラウンドサウンドを実現しており、理論的には、Atmos仕様の32音源だけでなく3D空間で数百の個別の音源を処理することでDolby Atmosを完全に凌駕し、プラットフォームホルダーとしての存在感を高めている。

それはまた、特別に誂えたオーディオ機器を必要とせず、そのサウンドを届けられるということだ。事実上、ソニーはオーディオとの境界線を突破し、「民主化」しようとしているのだ。

サラウンドサウンドの精度の向上は、PlayStation 3からPS4、そして約50種類の3D音源をサポートするPlayStation VRへと進化してきた。ソニーのGarry Taylor氏とSimon Gumbleton氏のインタビューを振り返れば、PlayStation 5のオーディオが基礎としている要素の多くが、Head-Related Transfer Function(HRTF 編者注:頭部伝達関数)の初期の使用を含め、PSVRで表面化しつつあったことは興味深い。

一般的に、ゲームオーディオを扱うタスクのスケールはすでに驚異的である――オーディオは48000Hz、256サンプル(編者注:1秒間のバッファサイズ)で処理される、つまり毎秒187.5オーディオ「ティック(編者注:目盛り)」があることを意味するのだからなおさらだ――それは、新規のオーディオを5.3msごとに伝送する必要があるということなのだ。ソニーのプロセッサが1ティックあたりに処理するデータの重さを考える際、この点に留意しよう。

HRTFがPS5オーディオの議論に登場するのはここだ。

マーク・サーニーはプレゼンテーションで自身のHRTFを披露したが、これは基本的には、頭の大きさや形、耳介の曲線などの変数でフィルタリングされた、オーディオの知覚をマッピングした図表だ。

おそらくあまりわかりやすくならなかったのは、我々の耳が同一でないということ、つまり実際には、2つのHRTF (両耳に1つずつ) を用いて定位追跡を解析する必要があるということだ。

f:id:keepitreal:20200405164144p:plain

「HRTFの議論がちょっとわかりにくいなら、ILD(Inter-aural Level Difference)やITD(Inter-aural Time Difference)といった、もう少し簡単に説明できる音像定位に関するいくつかの概念があります」マーク・サーニーは説明する。

「ILDは両耳間の強度差、つまりそれぞれの耳に届く音の強さの違いです。

それは周波数と位置によって異なり、音源が私の右にあるなら左耳に低周波の音はあまり聞こえず、高周波の音は全く聞こえません。

低周波の音は頭の周囲で回折(編者注:回り込むこと)できますが、高周波の音はできないからです。音は曲がらず、跳ね返ります。

ですからILDは、音がどこから来るのかと音の周波数に基づいて変化します。

もちろん、頭の大きさや形状でもそうです。ITD(両耳間時間差)は、音が右耳と左耳に届くまでの時間のことです」

「明らかに音源が目の前にある場合、両耳間の遅延はゼロです。

しかし音源が右側にある場合、音の速さを耳間距離で割ったくらいの遅延が生じます。

3Dオーディオアルゴリズムで使用するHRTFには、ILDとITDだけでなく、他の要素も含めてカプセル化しました」

HRTFは基本的に、IAD(編者注:Inter-aural Amplitude Difference両耳間振幅差)およびITDに従い、オブジェクトの位置を配置するために使える値を持つ3Dグリッドを提供するものの、全ての位置に対応する粒度は持ち合わせない。

このプロセスをさらに厄介にしているのは、人間の脳は信じられないほど高い精度を持つため、ここでのアルゴリズムは非常に効果的でなければならないということだ。

アルゴリズムがうまく機能しているかどうかを知る方法として、ピンクノイズ(編者注:周波数に反比例する雑音)を使う手法があります。

概念はホワイトノイズ(私たちがよく知っているものです)と似ています。

ピンクノイズの音源を使用し、移動させ、移動に伴い音源の趣きが変化すれば、アルゴリズムが不正確だということです」とサーニーは言う。

基本的に、ピンクサウンド(編者注:ノイズと同義)は人間の耳の周波数特性に近似するようフィルタリングされたホワイトサウンドだ。

アルゴリズムが不正確だと、フェージングアーティファクト(編者注:音が不安定になり小さくなること)を聞くことになる――耳を貝殻で覆ったような効果と似ている。

これはPlayStation VRの3Dオーディオ処理の限界の1つだったが、PlayStation 5のテンペストエンジンの強力なパワーのおかげで、アルゴリズム精度が向上し、よりクリーンでリアルな、より説得力のあるサウンドを実現した。

とはいえ実際の処理は、この数学の規模と範囲には及ばない。

「プレゼンテーションで圧倒的なHRTF処理の図式を使ったのは、動いている音を正確に処理するためには何が必要か、という複雑さを皆さんの前で明らかにしたかったことと、それを通して、なぜオーディオ処理専用ユニットを構築したのか、その理由を説明したかったからです」マーク・サーニーは付け加えた。

「本質的に言えば、直面するどんな課題へも無制限のパワーを投入できるようにしたかったのです。

言い換えると、コストを理由にそのアルゴリズムを選択するのではなく、結果として得られる効果のクオリティだけにフォーカスできるようにしたかったのです」

f:id:keepitreal:20200405165830p:plain

テンペストエンジンそのものは、サーニーがプレゼンテーションで説明したように、GPUの周波数で動作し1サイクル当たり64flops(浮動小数点演算)を実行する、刷新されたAMDコンピュートユニットである。

したがってエンジンの最高性能は100ギガflopsの範囲内にあり、これはPlayStation 4で使用された全8コアのJaguar CPUクラスタ全体に匹敵する。GPUアーキテクチャをベースとしているが、利用の仕方は非常に大きく異なっている。

GPUは数百、数千のWavefront(編者注:AMD GPUの命令供給のスレッドグループ)を処理し、テンペストエンジンは2つのWavefrontを処理します」マーク・サーニーは説明する。

「1つは3Dオーディオやその他のシステム機能用で、もう1つはゲーム用です。

帯域幅について言えば、テンペストエンジンは20GB/s以上を使えますが、オーディオがグラフィックス処理を一部でも削ってしまわないよう、少し注意が要ります。

オーディオ処理であまりに大きく帯域幅を使うと、グラフィックス処理が同時にシステムの帯域飽和を引き起こし、悪影響を及ぼす可能性があります」

基本的に、GPUは並列処理の原則――多くのタスク(または波)の同時実行という考え方に基づいている。テンペストエンジンはよりシリアルに近い性質のため、付加メモリキャッシュを必要としない。

テンペストエンジンを使用する場合は、データをDMAして処理し、再度DMAしてデータを返します。

これはまさにPlayStation 3のSPUで起きていたことです」とサーニーは付け加えた。

GPUとはまったく異なる様式です。

GPUはキャッシュを持ち、これはある意味すばらしい機能ですが、キャッシュラインが満杯になるまで待っている間に失速することもあります。

GPU には他の理由でも失速が発生します――GPUパイプラインには多くのステージがあり、各ステージには次を供給する必要があります。

結果として、GPUの使用率で40%の値を達成できれば、かなりうまくいっていると言えます。

対照的に、テンペストエンジンとその非同期DMAモデルでは、主要なコードで100%の利用率到達を目標としているわけです」

テンペストエンジンは、物理スピーカーにマッピングする仮想スピーカーシステム「Ambisonics(アンビソニックス)」と互換性を持つ。

任意のサウンドをスピーカー別に36の音量レベルでレンダリングでき、全てのスピーカーを使ってある程度は表現できる可能性が高く、プレゼンス(臨場感、存在感)が向上する。

ディスクリートオーディオでは物理スピーカーに「固定」される傾向があり、一部スピーカーではまったく表現できないかもしれない。

現在アンビソニックスはPlayStation 4PSVRで利用できるが、バーチャルスピーカーの数が少ないためテンペストエンジンによる精度の大幅なアップグレードが既に行われ、ソニーのより精密なローカライゼーションにも対応できる。

「ゲームオーディオでは、処理の種類が特定の音源に依存する戦略が見られるようになってきました」とサーニーは言う。

「例えば『ヒーローサウンド(重要なサウンドのことで、プレイヤーのヒーローが出すサウンドのことではありません)は、理想的なローカリティ(局所性)のために3Dオブジェクト処理を行い、一方、シーン内のサウンドの大部分はアンビソニックスを経由して、より高度なレベルのサウンドレベル制御を行います。

この種のハイブリッド・アプローチで、理論的には両方の世界で最高の部分を得られます。

そして、どちらもオーディオパイプラインの最後には同じHRTF処理が行われているので、どちらも同じように素晴らしいプレゼンスを得ることができます」

 

PS5の3Dオーディオをオーディオハードウェアに接続する方法

PlayStation 5プレゼンテーションでは、3Dオーディオの展開には時間がかかるだろうと指摘していた。コアテクノロジーは開発者向けに確立されているものの、多様なスピーカーシステムを使用するユーザーに結果を伝える作業はまだ進行中である。

発売時には、標準的ヘッドフォンを使うユーザーは、意図された通りの完全な体験を得られるはずだ。TVスピーカーやサウンドバー、5.1/7.1サラウンドシステムを使っている人にとっては、話はそれほどシンプルでない。

「TVスピーカーとステレオスピーカーでは、ユーザーが『TVバーチャルサラウンド』の有効無効を選択できるので、オーディオパイプラインは私が話していたように3Dではないオーディオが生成可能である必要があります」マーク・サーニーは説明する。

「バーチャルサラウンドサウンドはスイートスポット(編者注:この場合は、意図されたサウンドが最も良く聴ける物理的な範囲)で動作しますが、ユーザーはスイートスポットに座っていないかもしれませんし、ソファに座って共闘プレイ(両方のプレイヤーをスイートスポットに含めるのは難しい)をしているかもしれません。

バーチャルサラウンドサウンドが有効な場合、HRTFベースのアルゴリズムが使われます。

オフにすると、単純にダウンミックスされます。

例えば、3Dサウンドオブジェクトの位置によって、左右のスピーカーから来るサウンドの度合いが決まります」

彼がプレゼンテーションで述べた通り、TVとステレオスピーカーの基本的な実装は完了し、PlayStation5ハードウェアチームは最適化を続けているところだ。

「これら2ch(チャンネル)システムのソリューションを仕上げてから、5.1と7.1chシステムの課題に取り組む予定です」とサーニーは付け加えた。

「現状では、5.1chと7.1chのシステムではPS4で現在使用されているものに近いソリューションが得られています。

つまりサウンドオブジェクトの位置によって、各スピーカーからどの程度のサウンドが出るかが決まってきます。

5.1と7.1ch対応は、固有の特殊な問題を持つことに留意してください。

私は、2chシステムでは左耳は右のスピーカーの音を聞けるし、その逆もありえると言及しました。6や8chではさらに複雑なのです!

また、開発者がテンペストエンジンのパワーを使い6~8chに対応することに興味があるならば、ゲームコードはスピーカー設定を認識するので、オーダーメイドの対応が可能だ、ということも覚えておいてください」

f:id:keepitreal:20200405170342p:plain

まずヘッドフォンから対応し、次にバーチャルサラウンドとなるが(上図)、5.1/7.1スピーカーシステムのサポートはそれより後になる(下図)

f:id:keepitreal:20200405170401p:plain

PlayStation 5 次の展開は?

PlayStation 5には、不明点がいまだ多くある。マーク・サーニーはプレゼンテーションの中で、将来のある時点でティアダウン(編者注:分析的に分解すること)が行われるだろうと述べた。これはPlayStation 5の重要なコンポーネントであるサーマルアッセンブリ(編者注:ここでは冷却機構)を初めて見る機会となるが、マシンの実際のフォームファクタ(仕様や規格)を定義する役割を果たすものであり、願わくば早く見られることを期待している!

根本的なレベルでは、まだいくつか疑問符が残っている。

ソニーAMDの両社は、PlayStation 5がRDNA2ベースのカスタムグラフィックスコアを使用していることを認めた。しかし先日行われたDirectX12 Ultimateのリリースでは、AMDはVariable Rate Shading(編者注:VRS 可変レートシェーディング)など、ソニーが確認していない機能を認めている。

そしてスペックと実行には大きな隔たりがあるものだ――ソニーが共有したスペックは非常に印象的だが、プリンの味は食べてみなければわからない(編者注:論より証拠を指す慣用句)

今は旧型となった開発キットで動作する『Marvel's Spider-Man』を撮影した、グラグラしたカメラ映像(編者注:2019年5月21日 Sony 経営方針説明会で公開された比較映像)を除いては、レンダリングされた1個のピクセルも見ていないのである。

そしてそれは、私が次こそソニーに期待していることであり、ひとかけらのPlayStation 5体験なのだ。

PS4発売を間近に控えていたこの時期、すでに『Killzone Shadowfall』が動いていて輝かしく見えたものだ(今もそうだが)。もちろんゲームのプログラムは歓迎されるべきだが、体験に包まれるのも同様に重要だと感じている。

システムの起動はどのくらい速いのか?ゲームのロードは本当に一瞬か?Series Xの印象的なクイックレジュームに匹敵するものはあるか?フレームレートが固定されていないPS4タイトル(例えば『InFamous Second Sun)『Killzone Shadowfall』)はPS5で60fpsに固定されるか?

考えれば考えるほど疑問が湧いてくる――我々はPS5のシステムアーキテクチャに深く踏み込んだようだが、実際にはほんの入口に過ぎないと思い知らされるのだ。

 

〔元記事〕