DSDの概要とPCMとの違いを教えてください。
Direct Stream Digital(DSD)という用語は、ソニーとフィリップスが共同でSACDフォーマットを発表した時のことです。 これは、1970年代にフィリップスが最初に開発したデルタシグマ処理変調以外の何ものでもありません。 A / DおよびD / Aコンバータチップ内部の中間フォーマットとして使用された1980年代の後半には初めての市場参入がありました。
図1は、アナログソースがA / Dコンバータを介してデジタルPCMに変換された後、D / Aコンバータを介してアナログに再び戻っていく様子を示しています。 A / Dには2つの異なるプロセスが内部的に含まれています。
- デルタシグマ変調:アナログ信号は非常に高いサンプリングレートで直接DSDに変換されます。 アプリケーションと必要な忠実度に応じて、さまざまなアルゴリズムが使用されています。 通常のCDレートと比較して、64ビットまたは128ビットでオーバーサンプリングされた1ビットDSDまたはマルチビットDSDを生成することができます。
- デシメーションフィルタ:前のステップからのDSD信号をダウンサンプリングしてPCMに変換します。 ワード長が長くなり(たとえば16または24ビット)、高分解能PCMフォーマットの場合、サンプルレートがCDレートまたはその倍数になります。
- PCM信号ははるかに高いサンプルレートにアップコンバートされる。
- デルタシグマ変調器を介してDSDに変換され(ワード長を減らすために)
- 次にアナログに変換されます
DSDは2.8224MHz(64 x 44.1kHz)のサンプルレートで使用され、SACDプロダクション用には1サンプルあたり1ビットが使用されますが、録画機器も5.6448MHz(128 x 44.1kHz)の倍速で使用されています。 スタジオでは、アナログ形式のライブラリーをアーカイブするためにこの形式を使用することがよくあります。 この倍速DSD用の録音機器は、比較的安価に入手可能なので、消費者は愛用のビニールやテープ録音をデジタル形式で保存してから、オーディオフィルグレードのD / Aコンバータ(任意のPlayback Designs製品)を自分のリスニングルームで快適に使用できます。
2.8224MHz(64 x 44.1kHz)のサンプルレートを持つDSD信号の理論上の周波数帯域幅は1.4112MHzです。 これを、理論帯域幅が48kHzの96kHz PCM信号、または96kHzの帯域幅を持つ192kHz PCM信号と比較してください。 しかし、この広い帯域幅には価格が付いています。純粋なデルタシグマ信号は1ビットに量子化されているため、それ自体では大きなダイナミックレンジがありません。 そのため、デルタ - シグマ・コンバータは、使用可能なオーディオ範囲(0〜20kHz)でダイナミック・レンジを増加させ、次に高い周波数でゆっくりと減少させる「ノイズ・シェーピング」と呼ばれるプロセスを組み込む必要があります。 このノイズシェイプのデルタシグマ信号はDSDと呼ばれます。 図2は、2.8224MHzおよび5.6448MHzでサンプリングされたDSD信号の標準ダイナミックレンジを示しています。 周波数が高くなるにつれてゆっくりと上昇するノイズフロアも、最大100kHzで可聴であることが判明している過渡信号の聴力閾値にある程度従います。
もちろん、倍速(5.6448MHz)のDSDは、ノイズフロアが緩やかに上昇し始める0〜40kHzの拡張オーディオ範囲を持っています。
図2はまた、様々なサンプルレートでの高解像度PCM信号の理論的ダイナミックレンジを示す。 PCM信号に通常存在する険しい煉瓦壁に注意してください。 特別なアルゴリズム(すべてのPlayback Designs製品など)で処理されない場合、プリリンギングなどの非常に聞こえる副作用を生成することができるブリックウォールです。 設計上、DSDシグナルはこれらの副作用を生成しません。
これからわかるように、DSDは次のような特徴があります。
- オーディオ帯域の広いダイナミックレンジ(0〜20kHz)
- 高周波数でゆっくりと上昇するノイズフロア(ブリックウォールなし)
- MHzまでの拡張周波数範囲
ソニーのワークステーションで世界初のマルチチャンネルDSDレコーダーとエディター、ソニーのワークステーションである世界初のマルチチャンネルDSDコンバーター(ADCとDAC)を設計しているエンジニアチームを率いて、ソニーで最初からSACDの作成に携わりました。 SACDの世界標準化委員会に参加しました。 その後、AKDesignを設立し、PCMをDSD、DSDからPCM、DACのD / A変換およびクロックジッタ制御のための他の技術に変換する独自のDSD処理アルゴリズムを組み込んだOEM製品を設計し販売しています。 2008年に私はD / AコンバータとCD / SACDプレーヤーの形でDSDの優れた経験とノウハウを市場に出すためにPlayback Designsを共同設立しました。
Wavelength AudioのGordon Rankinを含む一部のメーカーは、DSDをネイティブに処理する現在の生産用DACチップがないと指摘しています。 この場合、現行の生産チップを使用するすべてのDSD DACが内部でDSDからPCMに変換されていますか?
ほとんどのDSD DACチップは、信号がアナログに変換される前に、すべてではないにしても、DSD信号をローパスフィルタして高周波ノイズ(図2を参照)を除去します。 このローパスフィルタの後段(実際のアナログ変換前)の信号は、元のDSD信号と同じサンプルレートを持つことができますが、もはや1ビットではありません。 これはまだDSDと考えることができますか?
「時には、周波数領域でDSMとPCMを区別して、より高い周波数帯域での特性の挙動を調べる方が有用な場合があります...」
DSD、またはデルタシグマ変調は、1ビット以上でエンコードでき、PCMは非常に高いサンプルレートを持つことができます。 ワード長とサンプルレートの基準のみを見ると、DSDとPCMの境界が不明瞭になる可能性があります。 時には、図2で指摘したように、周波数領域でDSDとPCMを区別し、より高い周波数帯域での特性の振舞いを調べるほうが有用な場合もあります。
私は、DSDとPCMとの間の音の違いの原因は、これらの信号がより高い周波数に対してどのように動作するかの違いにあると考えているため、DSD信号を積極的なフィルタでフィルタリングして高い周波数を平坦にすると、 PCM信号のように振る舞います。
「チップメーカがDACの入力に積極的なローパスフィルタを追加する理由は簡単です。アナログ出力が優れています。測定音ではなく実際の音楽信号でうまくいくかどうかはまったく異なる質問です」
チップメーカが積極的なローパスフィルタをDACの入力に追加するのは簡単ですが、アナログ出力の方が優れています。 測定音ではなく実際の音楽信号でよりうまく聞こえるかどうかは全く異なる質問です。 同様に、DSDを理解していないほとんどのオーディオメーカーやエンドユーザでさえも、高周波数でさえSignal-to-Noise性能に関心があり、周波数応答が完全にフラットではなく、ナイキストに。
その答えは「はい」です。ほとんどのDSD DACチップがアナログに変換される前にPCMに変換されるわけではありません。
これは、正弦波による測定の基準に従う必要のない、離散的に構築されたDACではなく、実際の音楽信号でのリスニング体験を可能にするドアを開きます。
「DSD対応DAC」がネイティブでDSDを扱うことができるかどうかを人々はどのように知っていますか?
多くのメーカーは、デジタル入力を介してネイティブにDSD信号を受信できると「DSD対応」を定義しています。 DSD信号が変換器の中に入ったら、DSD信号はどうなるのでしょうか? その質問の詳細を知りたい場合は、DACの製造元、使用されているチップ、または市販のチップがない場合のアルゴリズムの種類を調べる必要があります。 ほとんどのDACチップには、公開されているデータシートがあり、ダウンロードして勉強することができますが、技術的にはそれほど簡単ではありません。
残念ながら、この質問は多くのユーザーには簡単には答えられません。 しかし最終的には、私たち自身の耳を使って、偉大な音とそれほど素晴らしい音の究極の裁判官になればならないでしょうか?
しかし、最終的には、私たち自身の耳を使って、偉大な音とそれほど偉大ではない音の究極の裁判官になるべきではありませんか?
Gordon Rankinは、DoP(DSM over PCM)プロトコルが符号化/復号化プロセスにおいてオーバーヘッドを導入することを指摘している。 DoPプロトコルを改善することができますか?もし改善すれば、より良い音質が得られますか?
DoPプロトコルに関連するオーバヘッドは、「PCMコンテナ」で送信されている間にDSD信号を識別するためのものである。 これは、サウンド信号の実際のビットには関係しません。 議論は確かに、そのオーバーヘッドが音質に悪影響を及ぼすことはありえない。なぜなら、なぜUSBが一般的にどうしていいのか分からないからだ。 USBのオーバヘッドは、より伝統的なオーディオ伝送フォーマットに比べて巨大です。
DoPは、専用のDSD信号伝送を許可しないアプリケーション(例えば、Macコンピュータと外部DACの間)での妥協のソリューションです。 それは多くのメーカーからの寄稿によって創られました。 もちろん、そのようなソリューションは決して理想的ではなく、既存のアーキテクチャに応じて、特定のメーカーにとってより大きなまたはより小さな頭痛を引き起こす可能性があります。
人生の何かのように、常に改善の余地があり、それはDoPでも確かに真実です。 しかし、どんな改善も音質を向上させるかどうかは疑わしい。
DSDの1つの副産物は、望ましくない超音波ノイズです。 なぜこれに関わるべきかどうかについて話すことができますか?
ここでの本当の疑問は、この超音波ノイズが望ましくないかどうかである。 私たちの人間の聴覚は複雑で非常にダイナミックなプロセスです。 私たちは、正弦波で測定した結果生じる周波数応答でそれを記述しようと間違えることがよくあります。 これは非常に初歩的なものに過ぎず、音楽などのダイナミックな信号でどのように処理が行われるかについては説明していません。
聴覚プロセスの複雑さを理解し始めるには、それをより深い心理学に組み込む必要があります。 人工呼吸器で行われるように、音圧を神経信号に変換するという物理的なプロセスは、簡単な部分です。 私たちの脳の中で次に起こることは、最も理解されておらず、したがってかなり議論の余地がある部分です。
このテーマの詳細を詳しく説明することなく、私たちの聴覚は20kHzで停止するのではなく、ダイナミックな過渡信号のそれをはるかに超えていることが示されていることを指摘したい。 20kHz以上のダイナミックレンジは徐々に減少しますが、シャープなエッジを示すことはありません。 自然に発生する音のように、決して急激に落ちることはありません。 今度は図2のグラフをもう一度見て、人間の聴覚閾値と最もよく似ている曲線を教えてください。 DSD信号を選んでいただけませんか?
DSD信号の超音波ノイズは、まず音楽信号と無相関である。 私たちの聴覚アルゴリズムは、無相関な信号を "チューニングアウト"するのに非常に優れています。これは、2人が騒々しい環境で会話をする方法です。 ほとんどの場合、このノイズは振幅が非常に低く、しばしば聴力閾値を下回っています。
「...耳とそれに関連する心理学が既にノイズ除去の機能を果たしているため、より高い周波数(負の副作用の可能性がある)でフラットなPCMのような応答が「過剰」になる可能性があります。
フィルタとしてのヒアリングの機能のほとんどが誤解されていることを考えれば、私たちが技術を設計する方法で特定のアルゴリズムを回避でき、特定のアルゴリズムに関連する落とし穴を避けることができます。 その意味で、私たちの耳とそれに関連する心理学は既にノイズ除去の機能を果たしているので、より高い周波数(負の副作用の可能性がある)でフラットなPCM様応答が「過剰」である可能性があります。
最近のRMAF 2013では、ダブルレートDSDについて質問した多くの参加者が聞きました。 倍率DSDの利点は何ですか?
ダブルレートDSDは、図2に示すように、周波数領域でノイズシェーパをプッシュアップします。 DSD2xは、録音エンジニアがシングル・レートDSDで最終製品をリリースする際に劣化を起こすことなく録音や編集を行うために必要な特別なヘッドルームを提供するため、録音やポストプロダクションで最も興味深いものです。
アナログ音楽ライブラリをデジタル形式で保存したいと思っている趣味の人にとっては、興味深いことかもしれません。 そのようなアプリケーションでは、必要な余分なストレージスペースを気にする必要はなく、DSD2xファイルをインターネット経由で送信するときに帯域幅のボトルネックに悩まされることはありません。
しかし、スタジオからエンドユーザへの配信フォーマットとして、シングルレートDSDは、音質、帯域幅、および記憶スペースの最適な組み合わせを提供するように思われる。
私とStereophileのStephen Mejiasを含む多くの人々が、DSD再生の音質についてコメントしています。 スティーブンは、RMAFのショーレポートで、「全体的に滑らかさと楽さがあり、素晴らしく自然で強力なダイナミクスがある」と非常にうまく言いました。 DSDの優れたダイナミック機能のアカウントを指すことができるDSDの技術的側面がありますか?
もう少し上のことを話しました。 DSDの特性が「鋭いエッジ」がないことが優れていると思います。 自然に鋭いエッジがあるところでは、面白いことが起こります。 これは、家の角、レーダー・ディッシュ・アンテナ、およびレンガの壁を備えたPCMでエンコードされたオーディオを使用して太陽光が当てはまる場合にも当てはまります。
「DSDの特性上、「鋭いエッジ」がないことが優れていると思います。自然にシャープなエッジがあれば、面白いことが起こります」
SACDでの経験から、DSDに参加することを嫌う人もいれば、ソニーにある程度放棄された技術を買うことになります。 DSDは異なっていますか?もしそうなら、どうですか?
エンコーディング形式は一般的には消えませんが、通常は古くなって消える物理的な配信形式です。 DSDはエンコーディング形式であり、もはや物理的なキャリアに結び付けられていません。
再生設計MPD-5 DACはUSB経由で最大6.1MHzのDSDを処理できます。 なぜ6.1Mhz DSDですか?
6.1MHzまたは128 x 48kHzは、入力レシーバがすべてのPBD DACのデータを受け入れる理論上の制限です。 実際のD / Aコンバータは、さらに高い周波数で動作します(内蔵の将来の耐性)。