Định dạng file DSF định dạng file audio với dữ liệu nhạc DSD (1-bit
audio) và lưu dữ những thông tin đi kèm. Đây là một định dạng nhạc đã
gắn liền với khái niệm audiophile. Bây giờ chúng ta hãy cùng tìm hiểu về
những chất lượng nhạc, khả năng chuyển đổi, các vần đề gặp phải khi
phát nhạc, cấu trúc dữ liệu, etc…
DSD File bao gồm những gì
Nội dung
Toggle· Sample rates (tần số lấy mẫu) : 2.8 (D64), 5.6 (D128), 11.2 (D256), 22.5 (D512), 45.2 (D1024), … MHz
· Bit-depth: 1 bit / 8 bit
· Cấu trúc để giải mã : sigma delta module (a.k.a. DSD)
· Channel number: 1 … 6
· Metadata (song, album names, year, performer, artwork, etc.): ID3v2 format
Chi tiết hơn một chút thì
Sample rate DSD được tính bằng cách 44100 Hz x K (hệ số: 64=2^6, 128=2^7, 256=2^8, 512=2^9, 1024=2^10, etc)
Ví dụ: 44100 Hz * 64 = 2 822 400 Hz = 2.8 MHz
Ngoài ra DSD còn có thể được dựa trên tần số 4800 Hz (tuy nhiên dải này
không được công nhận chính thức) Tuy nhiên các dải vẫn có thể được thu
vào DSF tùy vào cách thu âm và mastering.
Cấu trúc của file audio DSF bao gồm:
1. Các giá trị trong header
2. Dữ liệu nhạc
3. Khối thông tin Metadata
Các dữ liệu nhạc sẽ được chia thành từng khối. Khối cuối cùng có thể
được viết một phần nhỏ. Việc ghi sai các dữ liệu trong header có thể dẫn
đến việc đọc luôn phần trống trong khối cuối cùng của file. Trong
trường hợp này có thể dẫn đến việc gây ra tiếng click trong cuối file
DSF.
Số lượng channel được hỗ trợ phải là số nguyên, vì vậy nếu
số channel vượt quá 6 thì vẫn có thể được hỗ trợ. DSF thường có số lượng
loại channel cụ thể và vị trí của channel được sắp xếp từ “mono”,
“stereo” đến “5.1”. Tuy nhiên, các số lượng channel đặc biệt khác vẫn có
thể được thu âm, tuy nhiên có thể gây lên vấn đề cho các thiết bị và
phần mềm giải mã.
DSF file nhạc chất lượng (DSD vs PCM)
Nếu chúng ta muốn so sánh chất lượng nhạc của DSD (sigma delta modulation) và PCM (pulse code modulation), chúng
tôi cũng đã thử bằng tai “trâu” của chúng tôi. So sánh giữa DSF và FLAC
hoặc những chuẩnfile khác. Tuy nhiên mọi thứ lại không chỉ đơn giản như
vậy
Đầu tiên các thông số kỹ thuật về thuật toán và các thiết bị đo đạc phần cứng cần phải được tách biệt rõ ràng.
File âm thanh có thể hiểu nôm na là cách áp dụng các phép toán vào
trong mô hình lý thuyết trong chế độ điều biến sigma delta. Và tiêu chí
cuối cùng đánh giá cuối cùng đó là quantization noise level (QNL: Độ
nhiễu lượng tử). Mức độ nhiễu cũng sẽ phục thuộc vào tần số)
Các
mạch điện tử sẽ là nhiễu đi tín hiệu số và các thuật toán bằng các thiết
bị điện tử không tuyến tính, các tần số đáp ứng khác nhau, tiếng rền do
các thiết bị điện, và khả năng bị nhiễu điện từ.
Các phần mềm
phát nhạc cũng sẽ có những ảnh hưởng riêng như những phương pháp
resample, các thuật toán tích hợp cũng như cắt ghép những mạch điều biến
delta sigma khác nhau, có thể dẫn thêm những thay đổi trong chức năng
cũng như chất âm
Bit depth (BD) và sample rate (SR)
DSD
bit depth sẽ có thể mang bất kỳ giá trị là số nguyên dương nào theo lý
thuyết. Bit depth và sample rate có thể được xem là tương đối phức tạp.
Nhưng cả hai giá trị này đều sẽ có ảnh hưởng đến độ nhiễu lượng tử:
higher BD or SR => lower QNL.
Các nhạc có bit depth cao hơn sẽ có sai số lượng tử thấp hơn, và vì thế mức QNL thấp hơn
Mức sample rate cao hơn cho phép mức băng thông rộng hơn cho các tín
hiệu âm thnah và các năng lượng do nhiễu sẽ được phân bổ trên một dải
rộng hơn vì vậy mức QNL được giảm đi nhiều.
Độ nhiễu lượng tử QNL
và sai số lượng tử QE là 2 điều khác nhau. QNL phụ thuộc vào QE. Tuy
nhiên với cùng một mức QE, QNL có thể sẽ khác nhau tương đối nhiều ví dụ
như đói với các tần số khác nhau.
Noise shaping (NS)
Để
giảm năng lượng đến từ các sai số lượng tử tại các dải tầncó thể nghe
thấy được,mạch điều biến sigma delta “đẩy mức năng lượng lên trên các
dải tần số cao. Các dải tần còn lại sẽ được làm dự trữ để làm cho việc
nắn nền và độ nhiễu.
Có các cách để làm tăng giải tín hiệu để truyền tải nhạc:
· tăng độ dốc trong việc điều chỉnh độ ồn của âm thanh
· Tăng giá trị tần số lấy mẫu
Tăng độ dốc trong Noise Shaping sẽ làm cho độ ổn định của mạch điều biến bị suy giảm đồng thời với khả năng bị quá tải
Tần số lấy mẫu cao hơn thì cũng sẽ làm tăng dung lượng file, tốn khả
năng xử lý của máy tính và cách lấy mẫu cũng như mastering sẽ tốn thời
gian.
Vậy liệu việc giảm bit depth có phải là giải pháp để đảm bảo chất lượng nhạc?
Các bạn có thể làm như vậy để kiểm soát mức nhiễu nền trong UMB, việc
noise shaping cần được áp dụng. Năng lượng do sai số lượng tử hóa từ các
dải tần số thấp sẽ được nắn lại và “đẩy lên” dải tần số cao. Tuy nhiên
chúng ta sẽ bị mất đi một phần trong dải tần số cao trong toàn bộ các
tần số đã được thu âm.
Noise Shaping có thể dẫn đến hiện tượng có
artefacts (chi tiết giả) tại một vài điểm bởi vì Non-linear distortion (
bị nắn tần số không tuyến tính)
Quantization
Độ nhiễu lượng tử của file DSD sẽ phụ thuộc vào hệ thống giải mã sigma delta bao gồm mạch điều biến và mạch giải điều.
Thông thường DSD64 sẽ có độ nhiễu lớn hơn so với DSD 128, DSD 256, DSD
512. Bởi vì DSD64 có dải băng tần dự trữ ít hơn so với các tần số lấy
mẫu cao hơn. Dải băng tần dự trữ thường được đặt ở tần số cao hơn, bởi
vì trong dải tần số cao có thể đẩy các năng lượng do tiếng nhiễu nhanh
hơn. Với tần số lấy mẫu thấp hơn- dải tần dự trữ ít hơn- những năng
lượng nhiễu sẽ được đẩy ra ít hơn mà không ảnh hưởng đến sự hoạt động ổn
định mạch điều biến Delta Sigma.
Trong phần sắp tới chúng ta sẽ
chỉ quan tâm đến mức noise level trong các dải băng tần hữu ích trong
các định dạng nhạc. Như bạn các bạn có thể thấy UMB mức độ ồn do
noise-shaping tăng dần với mức độ ngày càng cao hơn.
Trên bảng
dưới các bạn có thể nhìn thấy xu hướng sự rời rạc hóa của các tần số
nhạc DSF càng tỷ lệ thuận tăng lên. Điều quan trọng các bạn cần lưu ý,
rằng xu hướng trên phụ thuộc rất nhiều vào cách xử lý và lắp đặt mạch
điều biến và giải biến.
Kết luận
Từ góc nhìn của các mô hình toán học thì giữa DSD và PCM có những khác biệt giữa 2 phương diện:
· Độ nhiễu nền.
· Băng thông truyền tải tín hiệu.
Trong thực tế thì sẽ không có sự khác nhau giữa PCM và DSD, sự khác
nhau giũa Pulse Code PCM( điều chế xung mã) và Delta Sigma Module (điều
chế Sigma) chỉ nằm trên giấy tờ khi đơn giản chỉ là các format khác
nhau. Bởi vì format chỉ là một mô hình lý thuyết toán học, vì thế sẽ chỉ
khác nhau trong cách thu âm và cách lắp đặt mạch giải mã trong thực tế.
Những điểm khác nhau còn có thể do các phần mềm cũng như phần cứng của thiết bị,
Điều quan trọng nhất của nhà phát triển là nên tăng gì để làm giảm
noise: Sample rate hay bit depth. (Ngoài ra còn có thể áp dụng kỹ thuật
Noise Shaping)
Vì vậy sẽ không có một lợi ích cụ thể của PCM hay
DSD theo kiểu là một định dạng format nhất định (định dạng chỉ là một mô
hình toán học)
Tuy nhiên có thể sự khác biệt giữa 2 định dạng
này sẽ do phần cứng của DAC hay các phần mềm đọc file DSF như Jriver,
Roon, Foobar.. (bản thân mỗi phần mềm cũng có thuật toán giải mã khác
nhau)
Note: DSF vs. DFF
Dữ liệu âm thanh đã được số hóa ( 1bit binary) có thể được sao chép trực tiếp từ file DSF vào file DFF.
Tuy nhiên DFF không có tiêu chuẩn nào để lưu trữ metadata.
DFF chứa nhiều nhiều block dữ liệu khác nhau. Nó cho phép các dữ liệu
metadata vào các block, tuy nhiên các phần mềm đọc DFF sẽ dễ dàng nhận
diện các block metadata.