Làm thế nào để thưởng thức nhạc lossless và thiết bị âm thanh hi-end?

2025-05-29

Trong lĩnh vực nén âm thanh, có hai phương thức nén, lần lượt là nén lossy và nén lossless. Các định dạng chúng ta thường thấy như MP3, WMA, OGG được gọi là nén lossy, nén lossy như tên gọi là giảm tần số lấy mẫu âm thanh và tốc độ bit (bitrate), file âm thanh đầu ra sẽ nhỏ hơn file gốc.
Một phương thức nén âm thanh khác được gọi là nén lossless. Nén lossless có thể nén dung lượng file âm thanh nhỏ hơn với điều kiện giữ lại 100% tất cả dữ liệu của file gốc, và khi giải nén file âm thanh đã nén, có thể đạt được kích thước, tốc độ bit (bitrate) giống hệt file gốc. Hiện tại các định dạng nén lossless phổ biến có APE, FLAC, WAV. Dưới đây là so sánh giữa hai định dạng nén lossless này:
FLAC là viết tắt của Free Lossless Audio Codec, là một định dạng nén lossless rất trưởng thành, danh tiếng không kém APE! Mã nguồn của định dạng này hoàn toàn mở và tương thích với hầu hết các nền tảng hệ điều hành. Thuật toán mã hóa của nó khá trưởng thành, đã vượt qua các bài kiểm tra nghiêm ngặt, vẫn có thể phát bình thường ngay cả khi mã hóa bị hỏng. Ngoài ra, đây là định dạng lossless đầu tiên được hỗ trợ phần cứng rộng rãi, các sản phẩm kỹ thuật số nổi tiếng thế giới như: Máy nghe nhạc di động dùng ổ cứng Karma của Rio, hệ thống âm thanh ô tô MusicKeg của Kenwood và máy phát nhạc kỹ thuật số của PhatBox đều hỗ trợ định dạng FLAC.
APE là định dạng được tạo ra bởi chương trình Monkey's Audio nén file âm thanh WAV, file APE sau khi nén có dung lượng nhỏ hơn khoảng một nửa so với WAV gốc, nhưng phương pháp nén này không phải là nén phá hủy, nếu giải nén file APE này để khôi phục, file WAV thu được sẽ có kích thước hoàn toàn giống file WAV gốc, vì vậy APE còn được gọi là định dạng nén âm thanh lossless.
Định dạng WAV là định dạng file âm thanh do Microsoft phát triển, còn gọi là file âm thanh dạng sóng (waveform), là định dạng âm thanh kỹ thuật số sớm nhất, được hỗ trợ rộng rãi trên nền tảng Windows và các ứng dụng của nó. Định dạng WAV hỗ trợ nhiều thuật toán nén, hỗ trợ nhiều bit âm thanh, tần số lấy mẫu và kênh âm thanh, sử dụng tần số lấy mẫu 44.1kHz, độ phân giải 16 bit, vì vậy chất lượng âm thanh của WAV gần như không khác CD, nhưng định dạng WAV yêu cầu không gian lưu trữ quá lớn, không thuận tiện cho việc trao đổi và phổ biến.
(2) Sau khi chúng ta hiểu rõ nhạc lossless là gì, dưới đây hãy nói về cách thưởng thức âm nhạc nhé!
Chúng ta nghe nhạc chủ yếu gồm 3 thành phần: âm cao (treble), âm trung (mid), âm trầm (bass), [thực ra giống như nguyên lý hội họa: sáng, trung gian, tối, một tác phẩm cần ba mặt này mới có cảm giác lập thể]. Nhiều người sẽ nói ai cũng biết điều này, nhưng làm sao để phân biệt, định vị các thang âm này? Đối với âm thanh nhỏ, chỉ cần độ to (loudness) tăng lên một chút, tai người đã có thể cảm nhận được, nhưng khi độ to của âm thanh tăng đến một giá trị nhất định, dù có tăng thêm nhiều nữa thì cảm nhận của tai người cũng không thay đổi rõ rệt.
Thông thường chia dải âm nghe được (audible spectrum) thành ba phần theo quan hệ bát âm (octave) để xác định âm cao, trung, trầm, cụ thể: Dải âm trầm 20Hz-160Hz. Dải âm trung 160Hz-2000Hz. Dải âm cao 2000Hz-20000Hz. Dải âm trầm: Người chơi thiết bị âm thanh hi-end thường nói một câu, âm trầm là linh hồn của một bản nhạc!
Âm thanh phát ra từ dàn âm thanh tốt, âm trầm chắc, chính xác, gọn gàng và sạch sẽ. (Nhạc cụ đại diện: trống, cello, v.v.) Dải âm trung: Đây là dải âm tai người thích nhất, trong âm nhạc cần ngọt ngào, tinh tế, tự nhiên, giọng nói của chúng ta nằm trong phạm vi dải âm này, chỉ là dải âm của nữ giới cao hơn nam giới một chút, vì vậy đàn ông thích nghe phụ nữ nói hơn, phụ nữ cũng nói nhiều hơn (Nhạc cụ đại diện: kèn, guitar, v.v.) Dải âm cao: Nếu âm trầm là linh hồn của bản nhạc, thì âm cao là tinh túy của bản nhạc đó, âm cao nghe phải trong trẻo, ngọt ngào, tròn trịa và trôi chảy (Nhạc cụ đại diện: violin, sáo, v.v.).
Ví dụ: Bài "Độ Khẩu" (Dukou) của Thái Cầm (Cai Qin), mọi người có thể thưởng thức kỹ cảm giác về âm cao, trung, trầm trong đó. Đầu tiên, tiếng trống trầm hai nhẹ một mạnh rất đầy đặn, mạnh mẽ, tiếng guitar trong trẻo, trôi chảy, giọng Thái Cầm đầy chất giọng trầm ấm, âm trung rất êm dịu, tiếng guitar và mõ gỗ làm nhạc đệm rất có nhịp điệu. Xen giữa là một đoạn tiếng violin, kỹ thuật diễn tấu rất tinh tế, giàu chất liệu (texture), vài loại nhạc cụ và giọng hát Thái Cầm đan xen vào nhau, đẩy cảnh giới buồn đẹp đầy bất lực khi một đôi tình nhân sắp chia ly lên đến đỉnh điểm.
(3) Các yếu tố của HI-FI
1. Âm chất (Tonality). "Chất" là một thiên tính bẩm sinh, âm chất (tonality) chỉ chất lượng của âm thanh, nhiều người nhầm lẫn nó với "âm sắc" (timbre). Thế nào gọi là chất lượng âm thanh? Lấy ví dụ đơn giản nhất: Khi bạn nói một đôi giày chất lượng tốt, bạn chắc chắn muốn nói nó vừa chân, thoải mái, bền, chứ không phải kiểu dáng của nó có đẹp hay không, có hợp thời trang không. Tương tự, âm chất (tonality) chỉ chất lượng bên trong của âm thanh, còn âm sắc (timbre) chúng ta có thể hiểu là hình ảnh bên ngoài.
2. Âm sắc (Timbre). Âm sắc chỉ màu sắc của âm thanh. Âm chất (TONE QUALITY) và âm sắc (TIMBRE hoặc TONE COLOR) nhìn vào là biết chúng không chỉ cùng một việc. Chúng ta thường nghe nói: Cây violin này âm sắc thật lạnh, cây violin này âm sắc thật ấm, đó chính là nói về âm sắc của violin. Âm thanh cũng giống như ánh sáng, có màu sắc, nhưng nó không phải nhìn bằng mắt mà bằng tai nghe. Thông thường, âm sắc càng ấm thì âm thanh càng mềm; âm sắc càng lạnh thì âm thanh càng cứng. Giống như vải vậy, chất vải chỉ vật liệu của nó, màu vải chỉ màu sắc của nó, giữa chúng vẫn có ranh giới rõ ràng.
3. Phân bố và khả năng kiểm soát lượng cảm nhận (sense of quantity) ở các dải tần cao, trung, thấp. Mục này rất dễ hiểu, nhưng cũng dễ gây hiểu lầm khi truyền đạt bằng văn bản. Sao vậy? Mọi người đều nói: Cặp loa này âm cao quá mạnh, âm trầm quá ít, đó chính là sự phân bố lượng cảm nhận ở dải cao, trung, thấp. Vấn đề nằm ở chỗ nếu chia băng thông từ 20Hz đến 20KHz thành ba đoạn, thì tất nhiên sẽ phát sinh sự nhầm lẫn "không đủ chính xác". Vì vậy từ rất sớm đã có người tham khảo băng thông của nhạc cụ, và cách gọi âm thanh của dàn nhạc giao hưởng, chia tần số 20Hz-20KHz thành cực trầm (sub-bass), trầm (bass), trung trầm (low-mid), trung (mid), trung cao (high-mid), cao (treble), cực cao (super-treble) bảy đoạn.
4. Biểu hiện âm trường (Soundstage). "Âm trường" (Soundstage) rốt cuộc là gì? Tại Mỹ, "Sound Field" và "Sound Stage" là hai danh từ. "Sound Field" là toàn bộ không gian chứa đầy âm thanh; "Sound Stage" đặc chỉ cách sắp xếp của ban nhạc trên sân khấu (bao gồm rộng, sâu, cao, thấp). Tại Trung Quốc, cái chúng ta gọi là "âm trường" thực ra chỉ "Sound Stage"; còn "Sound Field", chúng ta đã từ lâu dùng một danh từ khác thay thế, đó là "cảm giác không gian" (sense of space). Vì vậy, khi chúng ta đề cập đến "hình dáng âm trường", chính là chỉ hình dạng sắp xếp của dàn nhạc mà thiết bị của bạn tái tạo.
Đối với biểu hiện âm trường, chúng ta có thể nghe từ những điểm sau: Một, vị trí âm trường; Hai, độ rộng âm trường; Ba, độ sâu âm trường.
5. Mật độ âm thanh (Density) và cảm giác trọng lượng (Weight). Cái gọi là mật độ âm thanh giống như một kg bông và một kg sắt, tất nhiên mật độ của sắt lớn hơn nhiều; vì vậy mặc dù trọng lượng của cả hai như nhau, nhưng sắt mang lại cảm giác trọng lượng lớn hơn nhiều. Âm thanh có mật độ lớn, nghe cảm giác như thế nào? Dây đàn có cảm giác dính (sticky), kèn đồng dày và đầy đặn, nhạc cụ gõ đánh lên đều có cảm giác không khí rung động, cuối cùng, làm cho nhạc cụ và giọng hát nghe ổn định hơn, vững chắc hơn, giống thật hơn.
6. Tính trong suốt (Transparency). Tính trong suốt gần như là một thuật ngữ chỉ có thể cảm nhận, khó diễn đạt bằng lời. Một số đĩa nhạc, thiết bị nghe trong suốt vô cùng, một số khác thì như phủ một lớp sương mù, chỉ cần là người chơi âm thanh có một chút kinh nghiệm đều có cảm giác này. Tính trong suốt đối với người chơi âm thanh là một khâu rất quan trọng, vì nếu tính trong suốt không tốt, nó cũng sẽ ảnh hưởng đến việc đánh giá các mục còn lại. Tính trong suốt tốt nhất là dịu dàng, nghe tai không mệt mỏi; tính trong suốt kém hơn giống như ánh nắng chói mắt, tuy nhìn rõ nhưng rất mệt thần kinh.
7. Cảm giác tầng thứ (Layering). Cảm giác tầng thứ rất dễ hiểu, nó chỉ khoảng cách hàng trước hàng sau của các nhạc cụ có thể tái tạo rõ ràng hay không. Lấy TV làm ví dụ, nếu có thể phân biệt được màu xám đậm và màu đen thì là có cảm giác tầng thứ. Âm thanh cũng vậy, cách sắp xếp của dàn nhạc không bị lẫn vào nhau là có cảm giác tầng thứ tốt, hơn nữa, chúng ta muốn nghe thấy khoảng không gian giữa các nhạc cụ với nhau, như vậy mới có cảm giác tầng thứ tốt nhất.
8. Cảm giác định vị (Positioning / Localization). Như tên gọi, cảm giác định vị là "định vị" vị trí ở đó. Tập trung không chuẩn thì cảm giác định vị kém, khả năng tạo hình ảnh (imaging) không tốt thì cảm giác định vị không được, xử lý không tốt các khâu trong khi thu âm cũng dẫn đến định vị trôi nổi; thậm chí trong không gian nghe nhạc của chúng ta, tỷ lệ âm thanh trực tiếp và âm phản xạ không tốt cũng sẽ dẫn đến định vị không chuẩn. Tóm lại, cảm giác định vị kém có thể do nhiều nguyên nhân, chúng ta không quan tâm nó hình thành thế nào, chúng ta yêu cầu là nhạc cụ hoặc giọng hát phải nổi bật và rõ ràng "định" ở đó, không nên di chuyển khi không cần thiết, không được lộn xộn khi không nên.
9. Cảm giác sống động (Liveliness / Life). Cái gọi là cảm giác sống động có thể nói là mặt khác của phản ứng tức thời (transient response), tốc độ (speed), tương phản mạnh yếu (dynamic contrast). Nó làm cho bạn nghe nhạc rất sống động, không chết cứng. Đây là một yếu tố quan trọng để âm nhạc hay hay không, giống như một nhạc trưởng xuất sắc có thể chỉ huy âm nhạc tràn đầy sức sống; còn nhạc trưởng kém cỏi thường làm cho âm nhạc trở nên chết cứng, đó chính là cảm giác sống động của âm nhạc.
10. Khả năng tạo hình ảnh (Imaging) và cảm giác hình thể (Body / Physicality). Như tên gọi, khả năng tạo hình ảnh là khả năng kết đọng hình ảnh âm thanh mờ ảo thành một thực thể; nói cách khác, là khả năng thể hiện hình thể lập thể của giọng hát hoặc nhạc cụ. Nhiều người chơi âm thanh thường gộp mục này vào (cảm giác hình thể), nhưng chúng tôi cho rằng dùng khả năng tạo hình ảnh và cảm giác hình thể có thể cụ thể hơn. Thiết bị âm thanh có khả năng tạo hình ảnh tốt sẽ làm hình ảnh âm thanh nổi bật hơn, có cảm giác lập thể hơn, tức là chúng ta thường nói đường viền hình ảnh âm thanh (image contour) có bóng đổ rõ ràng hơn.
11. Khả năng phân giải (Resolution). Danh từ này dễ hiểu nhất, người chơi máy ảnh đều biết sự khác biệt về khả năng phân giải của ống kính; người xem TV cũng biết TV của mình có thể phân giải một mảng tóc màu đen không hề bị lẫn là biểu hiện của khả năng phân giải tốt. Thiết bị âm thanh tốt, dù là thứ nhỏ nhặt, phức tạp nhất cũng có thể biểu đạt rõ ràng, đó chính là khả năng phân giải. Nhưng phải nhấn mạnh rằng, khả năng phân giải không thể đại diện cho tất cả sự tái tạo chi tiết và cảm giác tầng thứ.
12. Cảm giác tốc độ (Speed) và phản ứng tức thời (Transient Response). Thực ra, cảm giác tốc độ chính là kết quả của phản ứng tức thời, cũng là biểu hiện cụ thể của thời gian lên (rise time) và tốc độ quay vòng (slew rate) của thiết bị. Người nước ngoài thường nói mục này là phản ứng (response) chứ không nói cảm giác tốc độ. Đối với người Việt, cảm giác tốc độ dễ hiểu hơn phản ứng tức thời. Về cơ bản, hai danh từ này đều chỉ tốc độ nhanh chậm của các phản ứng của thiết bị. Tôi nghĩ, ở đây không cần giải thích thêm.
13. Tương phản mạnh yếu (Dynamic Contrast) và dải động (Dynamic Range). Tương phản mạnh yếu cũng có thể gọi là dải động như người nước ngoài nói, tức là sự tương phản giữa to và nhỏ. Nói chung, tương phản mạnh yếu cũng có thể chia thành tương phản mạnh yếu "chênh lệch lớn" và tương phản mạnh yếu "chênh lệch cực nhỏ". Chúng ta thường nói dải động của nhạc cổ điển rất lớn là chỉ sự tương phản giữa phần to nhất và nhỏ nhất của nó rất lớn; thế nào là tương phản mạnh yếu chênh lệch cực nhỏ? Tức là sự tương phản rất nhỏ, rất gần nhau. Tương phản mạnh yếu nói theo cách đơn giản nhất nên là: Tương phản mạnh yếu cực lớn là sóng biển đập vào bờ đá; tương phản mạnh yếu cực nhỏ là gợn sóng hồ nước dưới làn gió nhẹ.
14. Tỷ lệ kích thước giữa nhạc cụ và giọng hát (Scale). Tỷ lệ kích thước giữa nhạc cụ và giọng hát như thế nào mới được coi là hợp lý? Người theo chủ nghĩa lý tưởng cho rằng nên thu nhỏ theo tỷ lệ kích thước thực tế của dàn nhạc để đặt vào phòng nghe nhạc tại nhà. Trên thực tế, điều này là không thể. Chúng tôi lấy một ví dụ đơn giản nhất: Khi piano và violin cùng trình diễn bản sonata, hình thể piano không biết lớn hơn violin bao nhiêu lần. Nếu khi thu âm không tăng âm lượng violin, violin thường bị piano lấn át. Tỷ lệ kích thước chính xác giữa nhạc cụ và giọng hát không phải là thu nhỏ một cách cứng nhắc, mà là làm tỷ lệ kích thước theo yêu cầu âm nhạc hợp lý. Nhạc cụ như vậy, giọng hát cũng thế. Chúng ta thường nghe một số bản nhạc DJ sẽ xuất hiện hiện tượng này, chỉ nghe thấy nhịp điệu rất mạnh, nhưng giọng hát lại rất nhỏ, cảm giác không hay.
15. Chất liệu (Texture), cảm giác không khí (Air) của nhạc cụ và giọng hát. Ở đây chúng tôi không nói về chất liệu (texture) trong âm chất (tonality) đó, mà là chất liệu (texture) phát sinh từ hành động chạm, gõ trong khoảnh khắc khi nhạc cụ trình diễn. Vì vậy, khi chúng ta nói: "Chất liệu kéo dây violin rất tốt", có nghĩa là "Nó thu rất giống violin". Còn "cảm giác không khí" là gì? Thực ra chính là cảm giác của luồng khí. Nói rõ hơn, "cảm giác không khí" là cảm giác rung động của sóng âm. Cái gọi là chất liệu (texture) cũng chính là chỉ "độ chân thực" (fidelity), phần lớn là cảm giác khoảnh khắc sau khi "tiếp xúc".
16. Tái tạo chi tiết (Detail Retrieval). Chi tiết đại khái là chỉ chi tiết của nhạc cụ, sự tái tạo tinh tế của âm vang (reverberation) và tất cả tiếng ồn trong không gian thu âm. Số lượng chi tiết tái tạo của một thiết bị âm thanh rất dễ so sánh thông qua AB Test. Tại sao một số thiết bị tái tạo được nhiều chi tiết hơn? Chúng tôi cho rằng điều này liên quan đến độ méo thấp, tỷ lệ tín hiệu trên nhiễu cao, độ nhạy cao, khả năng phân giải, tính trong suốt, v.v. Thiết bị tái tạo ít chi tiết nghe phẳng và nhàm chán; thiết bị tái tạo nhiều chi tiết nghe thú vị vô cùng.
17. Cảm giác không gian (Sense of Space). Chúng ta thường nói nếu một hệ thống âm thanh (bao gồm thiết bị, đĩa nhạc và không gian) có thể "làm nổi âm trường (soundstage)", thì nó chắc chắn cũng "có thể nhìn thấy" cảm giác không gian. Xin lưu ý, là "nhìn thấy" chứ không phải "nghe thấy", âm trường và cảm giác không gian thực sự biểu hiện tốt tuyệt đối có thể "nhìn thấy", chứ không chỉ "nghe thấy" mà thôi. Cảm giác không gian là gì? Đó là kích thước thực ba chiều của địa điểm thu âm. Để có thể hoàn toàn thể hiện được cảm giác không gian, sự tái tạo chi tiết tuyệt vời là tuyệt đối cần thiết, đặc biệt là sự tái tạo "âm vang" (reverberation).
18. Tính cân bằng tổng thể (Overall Balance). Bất kỳ đĩa nhạc hay thiết bị âm thanh nào cũng nên như nhạc trưởng đang điều khiển dàn nhạc, cần đạt được một sự cân bằng tổng thể. Điều này giống như trong một dàn nhạc, ai cũng là nghệ sĩ độc tấu điêu luyện, nhưng nếu ai cũng ra mặt, không nghe sự diễn giải của nhạc trưởng, như vậy tuy trình độ biểu diễn cá nhân cao, nhưng sự cân bằng tổng thể của dàn nhạc chắc chắn rất kém, như vậy không phải là một dàn nhạc tốt. Về mục này, chúng ta không thể dùng thước đo để đo lường, việc phân biệt tính cân bằng tổng thể giống như phải nghe nhiều buổi hòa nhạc mới phân biệt được dàn nhạc tốt xấu, chỉ có thể dựa vào kinh nghiệm nghe nhạc phong phú của bản thân để phán đoán.
19. Cá tính thiết bị. Đĩa nhạc, thiết bị âm thanh đều như con người, có cá tính riêng, một số nghe như quý ông, một số như kẻ nóng nảy; một số dịu dàng như tiểu thư, một số khác lại nồng nhiệt như Carmen; do cá tính khác nhau, vì vậy trong việc phối ghép cũng phải như hôn nhân đại sự, phải thận trọng. Hai thiết bị tính khí nóng nảy ghép với nhau, chắc chắn sẽ khiến bạn khó chịu. Ngược lại, hai thiết bị tính khí chậm chạp, ì ạch ghép với nhau cũng làm bạn sốt ruột chết đi được. Vì vậy, nhận thức về cá tính thiết bị là tuyệt đối cần thiết.
20. Phối ghép thiết bị. Như đã nói ở trước, mỗi đĩa nhạc, mỗi thiết bị đều có cá tính riêng, việc phối ghép thiết bị không phù hợp thường ảnh hưởng lớn hơn cả bản thân chất lượng thiết bị. Không chỉ người chơi âm thanh thông thường, ngay cả một số chuyên gia cũng thường vì phối ghép không phù hợp mà hiểu lầm năng lực thực sự của bản thân thiết bị, đây là điều rất đáng tiếc. Vì vậy khi cấu hình thiết bị, phải dựa trên đặc điểm biểu hiện âm nhạc của thiết bị để phối ghép hợp lý hóa.
(4) Tóm tắt:
Bài viết "Làm thế nào để thưởng thức nhạc lossless và thiết bị âm thanh hi-end" này mục đích là để mọi người giao lưu lẫn nhau, cùng nâng cao trình độ thưởng thức của mình. Cũng có người nói không biết phối ghép thiết bị âm thanh thế nào? Thông qua học tập chúng ta nên có thể tự định vị cho mình, chọn những dàn âm thanh nào phù hợp để mình nghe. Cũng có người thường hỏi: Bạn dùng dàn âm thanh gì? Thực ra trình độ thưởng thức, thính giác, sở thích, điều kiện kinh tế, v.v. của mỗi người đều có sự khác biệt, khi chọn dàn âm thanh nhất định phải dựa vào sở thích cá nhân, lựa chọn có mục đích mới là đúng đắn. Mọi người nên giao lưu nhiều hơn kiến thức về lĩnh vực này, cùng nâng cao trình độ thưởng thức của mọi người!

Tin tức

Làm thế nào để thưởng thức nhạc lossless và thiết bị âm thanh hi-end?