Cảm giác âm thanh nổi (stereo) được hình thành như thế nào?
1 Khái niệm âm thanh nổi (stereo)
Âm thanh nổi (stereo) là một khái niệm hình học, chỉ sự vật chiếm vị trí trong không gian ba chiều. Vậy âm thanh có phải là nổi không? Về mặt so sánh, câu trả lời có thể là khẳng định. Vì nguồn âm có vị trí không gian xác định, âm thanh có nguồn gốc phương hướng rõ ràng, thính giác con người có khả năng phân biệt phương hướng nguồn âm; đặc biệt là khi có nhiều nguồn âm đồng thời phát ra, con người có thể dựa vào thính giác để cảm nhận tình trạng phân bố trong không gian của nhóm âm. Vì vậy có thể nói âm thanh là "nổi". Tuy nhiên, cách nói thích hợp hơn nên là: "Âm thanh nguyên bản (nguyên phát) là nổi." Bởi vì khi âm thanh đã qua quá trình ghi âm, khuếch đại, xử lý rồi mới phát lại, tất cả âm thanh đều có thể phát ra từ một chiếc loa duy nhất, âm thanh phát lại này không còn là nổi nữa. Lúc này do tất cả các âm thanh đều phát ra từ cùng một chiếc loa, cảm giác không gian ban đầu - đặc biệt là cảm giác phân bố không gian của nhóm âm - cũng biến mất. Âm thanh phát lại này được gọi là "âm đơn" (Mono). Nếu hệ thống phát lại có thể khôi phục ở một mức độ nào đó cảm giác không gian của âm thanh nguyên phát, thì âm thanh phát lại đó được gọi là "âm thanh nổi" (Stereo). Vì âm thanh nguyên phát đương nhiên là "nổi", nên thuật ngữ âm thanh nổi đặc chỉ loại âm thanh phát lại có cảm giác không gian (hoặc phương vị) nào đó.
2 Hiệu ứng hai tai (binaural effect)
Để khôi phục cảm giác không gian trong âm thanh phát lại, trước tiên phải hiểu tại sao hệ thống thính giác của con người lại có khả năng phân biệt phương hướng nguồn âm. Nghiên cứu phát hiện ra rằng, điều này chủ yếu là do con người có hai tai chứ không phải chỉ một tai.
Tai mọc ở hai bên đầu, chúng không chỉ cách nhau một khoảng trong không gian, mà còn bị hộp sọ ngăn cách, vì vậy âm thanh mà hai tai tiếp nhận có thể có những khác biệt nhất định. Chính nhờ chủ yếu dựa vào những khác biệt này, con người có thể phân biệt vị trí nguồn âm trong không gian. Những khác biệt này chủ yếu gồm các loại sau:
(1) Hiệu ứng thời gian đến hai tai (ITD - Interaural Time Difference)
Do khoảng cách nhất định giữa tai trái và tai phải, vì vậy ngoại trừ âm thanh đến từ ngay phía trước hoặc ngay phía sau, âm thanh từ các hướng khác đến hai tai sẽ có trước sau, tạo ra chênh lệch thời gian. Nếu nguồn âm lệch về bên phải, thì âm thanh sẽ đến tai phải trước rồi mới đến tai trái; ngược lại, thì sẽ đến tai trái trước rồi mới đến tai phải. Nguồn âm càng lệch về một bên, chênh lệch thời gian càng lớn. Thực nghiệm chứng minh, nếu cố tình tạo ra chênh lệch thời gian nghe giữa hai tai, có thể tạo ra ảo giác nguồn âm lệch về một bên. Khi chênh lệch thời gian đạt khoảng 0.6ms, sẽ cảm thấy âm thanh hoàn toàn đến từ một bên.
(2) Hiệu ứng mức âm đến hai tai (ILD - Interaural Level Difference)
Hai tai tuy cách nhau không xa, nhưng do tác dụng ngăn cản âm thanh của hộp sọ, mức âm thanh đến hai tai có thể khác nhau. Bên gần nguồn âm hơn sẽ có mức âm lớn hơn, còn bên kia nhỏ hơn. Thực nghiệm chứng minh, chênh lệch mức âm lớn nhất có thể lên tới khoảng 25dB.
(3) Hiệu ứng pha đến hai tai (IPD - Interaural Phase Difference)
Mọi người đều biết âm thanh truyền đi dưới dạng sóng, mà sóng âm ở các vị trí khác nhau trong không gian có pha khác nhau (trừ khi cách nhau đúng một bước sóng). Do hai tai cách nhau một khoảng trong không gian, nên pha của sóng âm khi đến hai tai có thể có sự khác biệt. Màng nhĩ trong tai rung động theo sóng âm, sự chênh lệch pha của rung động này cũng trở thành một yếu tố để chúng ta phán đoán phương hướng nguồn âm. Thực nghiệm chứng minh, ngay cả khi mức âm, thời gian âm thanh đến hai tai đều giống nhau, chỉ cần thay đổi pha của nó, chúng ta cũng sẽ cảm thấy phương hướng nguồn âm khác biệt rất lớn.
(4) Hiệu ứng âm sắc đến hai tai
Nếu sóng âm đến từ một hướng nào đó bên phải, nó phải đi vòng qua một số phần của đầu mới đến được tai trái. Đã biết khả năng nhiễu xạ của sóng liên quan đến tỷ lệ giữa bước sóng và kích thước vật cản, đường kính đầu người khoảng 20cm, tương đương bước sóng âm thanh 1.700Hz trong không khí, vì vậy đầu người có tác dụng che chắn đối với các thành phần âm thanh trên một nghìn Hz. Nghĩa là, khả năng đi vòng qua đầu của các thành phần khác nhau trong cùng một âm thanh là khác nhau, tần số càng cao thì thành phần đó càng bị suy giảm nhiều. Do đó, âm sắc mà tai trái nghe thấy sẽ khác với âm sắc tai phải nghe thấy, từ đó trở thành một cơ sở để con người phán đoán phương hướng nguồn âm.
(5) Sự khác biệt do âm thanh trực tiếp (direct sound) và quần thể âm thanh phản xạ liên tục (reflected sound) tạo ra
Âm thanh phát ra từ nguồn âm, ngoài âm thanh trực tiếp đến hai tai chúng ta, còn sẽ phản xạ một hoặc nhiều lần qua các chướng ngại vật xung quanh tạo thành quần thể âm thanh phản xạ, lần lượt đến hai tai chúng ta. Do đó, sự khác biệt giữa âm thanh trực tiếp và quần thể âm thanh phản xạ, cũng sẽ cung cấp thông tin về sự phân bố nguồn âm trong không gian.
(6) Sự khác biệt do vành tai (pinna) tạo ra
Vành tai hướng về phía trước, rõ ràng có thể giúp con người phân biệt trước sau. Mặt khác, hình dạng của vành tai rất tinh vi, âm thanh đến từ các phương hướng khác nhau sẽ tạo ra hiệu ứng phức tạp trong đó, chắc chắn cũng cung cấp một số thông tin về phương vị.
Thực tế chứng minh, trong số những khác biệt nêu trên, chênh lệch mức âm, chênh lệch thời gian và chênh lệch pha là ba yếu tố có ảnh hưởng lớn nhất đến định vị thính giác. Tuy nhiên, trong các điều kiện khác nhau, tác dụng của chúng cũng không giống nhau. Nói chung, ở dải tần thấp và trung của âm thanh, chênh lệch pha có tác dụng lớn hơn; ở dải trung và cao, chênh lệch mức âm đóng vai trò chủ yếu. Đối với âm thanh đột ngột (impulse sound), thì chênh lệch thời gian có tác dụng đặc biệt nổi bật. Còn trong định vị theo chiều dọc, vành tai đóng vai trò quan trọng hơn. Thực tế, hiệu ứng hai tai là tổng hợp, hệ thống thính giác của con người lẽ ra phải dựa vào hiệu ứng tổng hợp để phán đoán phương hướng nguồn âm.
Tiện thể chỉ ra, hệ thống thính giác của con người ngoài cảm giác về độ lớn, âm sắc, phương vị, còn có nhiều hiệu ứng khác. Trong đó có một hiệu ứng liên quan mật thiết đến các bài giảng sau này của chúng ta, gọi là "hiệu ứng ưu tiên" (Precedence Effect) (còn gọi là "hiệu ứng Haas"). Từ thực nghiệm biết được, khi hai âm thanh giống nhau, một âm bị trễ, lần lượt đến hai tai chúng ta, nếu thời gian trễ trong vòng 30ms, thì con người sẽ không cảm nhận được sự tồn tại của âm bị trễ, chỉ có thể nhận thấy sự thay đổi về âm sắc và độ lớn. Nhưng nếu thời gian trễ quá dài, tình hình sẽ khác. Mọi người đều đã biết, khi chênh lệch thời gian giữa hai âm thanh đến trước sau vượt quá 50ms-60ms (tương đương chênh lệch quãng đường âm thanh lớn hơn 17m), người nghe có thể cảm nhận được.
Âm thanh nổi (stereo) là một khái niệm hình học, chỉ sự vật chiếm vị trí trong không gian ba chiều. Vậy âm thanh có phải là nổi không? Về mặt so sánh, câu trả lời có thể là khẳng định. Vì nguồn âm có vị trí không gian xác định, âm thanh có nguồn gốc phương hướng rõ ràng, thính giác con người có khả năng phân biệt phương hướng nguồn âm; đặc biệt là khi có nhiều nguồn âm đồng thời phát ra, con người có thể dựa vào thính giác để cảm nhận tình trạng phân bố trong không gian của nhóm âm. Vì vậy có thể nói âm thanh là "nổi". Tuy nhiên, cách nói thích hợp hơn nên là: "Âm thanh nguyên bản (nguyên phát) là nổi." Bởi vì khi âm thanh đã qua quá trình ghi âm, khuếch đại, xử lý rồi mới phát lại, tất cả âm thanh đều có thể phát ra từ một chiếc loa duy nhất, âm thanh phát lại này không còn là nổi nữa. Lúc này do tất cả các âm thanh đều phát ra từ cùng một chiếc loa, cảm giác không gian ban đầu - đặc biệt là cảm giác phân bố không gian của nhóm âm - cũng biến mất. Âm thanh phát lại này được gọi là "âm đơn" (Mono). Nếu hệ thống phát lại có thể khôi phục ở một mức độ nào đó cảm giác không gian của âm thanh nguyên phát, thì âm thanh phát lại đó được gọi là "âm thanh nổi" (Stereo). Vì âm thanh nguyên phát đương nhiên là "nổi", nên thuật ngữ âm thanh nổi đặc chỉ loại âm thanh phát lại có cảm giác không gian (hoặc phương vị) nào đó.
2 Hiệu ứng hai tai (binaural effect)
Để khôi phục cảm giác không gian trong âm thanh phát lại, trước tiên phải hiểu tại sao hệ thống thính giác của con người lại có khả năng phân biệt phương hướng nguồn âm. Nghiên cứu phát hiện ra rằng, điều này chủ yếu là do con người có hai tai chứ không phải chỉ một tai.
Tai mọc ở hai bên đầu, chúng không chỉ cách nhau một khoảng trong không gian, mà còn bị hộp sọ ngăn cách, vì vậy âm thanh mà hai tai tiếp nhận có thể có những khác biệt nhất định. Chính nhờ chủ yếu dựa vào những khác biệt này, con người có thể phân biệt vị trí nguồn âm trong không gian. Những khác biệt này chủ yếu gồm các loại sau:
(1) Hiệu ứng thời gian đến hai tai (ITD - Interaural Time Difference)
Do khoảng cách nhất định giữa tai trái và tai phải, vì vậy ngoại trừ âm thanh đến từ ngay phía trước hoặc ngay phía sau, âm thanh từ các hướng khác đến hai tai sẽ có trước sau, tạo ra chênh lệch thời gian. Nếu nguồn âm lệch về bên phải, thì âm thanh sẽ đến tai phải trước rồi mới đến tai trái; ngược lại, thì sẽ đến tai trái trước rồi mới đến tai phải. Nguồn âm càng lệch về một bên, chênh lệch thời gian càng lớn. Thực nghiệm chứng minh, nếu cố tình tạo ra chênh lệch thời gian nghe giữa hai tai, có thể tạo ra ảo giác nguồn âm lệch về một bên. Khi chênh lệch thời gian đạt khoảng 0.6ms, sẽ cảm thấy âm thanh hoàn toàn đến từ một bên.
(2) Hiệu ứng mức âm đến hai tai (ILD - Interaural Level Difference)
Hai tai tuy cách nhau không xa, nhưng do tác dụng ngăn cản âm thanh của hộp sọ, mức âm thanh đến hai tai có thể khác nhau. Bên gần nguồn âm hơn sẽ có mức âm lớn hơn, còn bên kia nhỏ hơn. Thực nghiệm chứng minh, chênh lệch mức âm lớn nhất có thể lên tới khoảng 25dB.
(3) Hiệu ứng pha đến hai tai (IPD - Interaural Phase Difference)
Mọi người đều biết âm thanh truyền đi dưới dạng sóng, mà sóng âm ở các vị trí khác nhau trong không gian có pha khác nhau (trừ khi cách nhau đúng một bước sóng). Do hai tai cách nhau một khoảng trong không gian, nên pha của sóng âm khi đến hai tai có thể có sự khác biệt. Màng nhĩ trong tai rung động theo sóng âm, sự chênh lệch pha của rung động này cũng trở thành một yếu tố để chúng ta phán đoán phương hướng nguồn âm. Thực nghiệm chứng minh, ngay cả khi mức âm, thời gian âm thanh đến hai tai đều giống nhau, chỉ cần thay đổi pha của nó, chúng ta cũng sẽ cảm thấy phương hướng nguồn âm khác biệt rất lớn.
(4) Hiệu ứng âm sắc đến hai tai
Nếu sóng âm đến từ một hướng nào đó bên phải, nó phải đi vòng qua một số phần của đầu mới đến được tai trái. Đã biết khả năng nhiễu xạ của sóng liên quan đến tỷ lệ giữa bước sóng và kích thước vật cản, đường kính đầu người khoảng 20cm, tương đương bước sóng âm thanh 1.700Hz trong không khí, vì vậy đầu người có tác dụng che chắn đối với các thành phần âm thanh trên một nghìn Hz. Nghĩa là, khả năng đi vòng qua đầu của các thành phần khác nhau trong cùng một âm thanh là khác nhau, tần số càng cao thì thành phần đó càng bị suy giảm nhiều. Do đó, âm sắc mà tai trái nghe thấy sẽ khác với âm sắc tai phải nghe thấy, từ đó trở thành một cơ sở để con người phán đoán phương hướng nguồn âm.
(5) Sự khác biệt do âm thanh trực tiếp (direct sound) và quần thể âm thanh phản xạ liên tục (reflected sound) tạo ra
Âm thanh phát ra từ nguồn âm, ngoài âm thanh trực tiếp đến hai tai chúng ta, còn sẽ phản xạ một hoặc nhiều lần qua các chướng ngại vật xung quanh tạo thành quần thể âm thanh phản xạ, lần lượt đến hai tai chúng ta. Do đó, sự khác biệt giữa âm thanh trực tiếp và quần thể âm thanh phản xạ, cũng sẽ cung cấp thông tin về sự phân bố nguồn âm trong không gian.
(6) Sự khác biệt do vành tai (pinna) tạo ra
Vành tai hướng về phía trước, rõ ràng có thể giúp con người phân biệt trước sau. Mặt khác, hình dạng của vành tai rất tinh vi, âm thanh đến từ các phương hướng khác nhau sẽ tạo ra hiệu ứng phức tạp trong đó, chắc chắn cũng cung cấp một số thông tin về phương vị.
Thực tế chứng minh, trong số những khác biệt nêu trên, chênh lệch mức âm, chênh lệch thời gian và chênh lệch pha là ba yếu tố có ảnh hưởng lớn nhất đến định vị thính giác. Tuy nhiên, trong các điều kiện khác nhau, tác dụng của chúng cũng không giống nhau. Nói chung, ở dải tần thấp và trung của âm thanh, chênh lệch pha có tác dụng lớn hơn; ở dải trung và cao, chênh lệch mức âm đóng vai trò chủ yếu. Đối với âm thanh đột ngột (impulse sound), thì chênh lệch thời gian có tác dụng đặc biệt nổi bật. Còn trong định vị theo chiều dọc, vành tai đóng vai trò quan trọng hơn. Thực tế, hiệu ứng hai tai là tổng hợp, hệ thống thính giác của con người lẽ ra phải dựa vào hiệu ứng tổng hợp để phán đoán phương hướng nguồn âm.
Tiện thể chỉ ra, hệ thống thính giác của con người ngoài cảm giác về độ lớn, âm sắc, phương vị, còn có nhiều hiệu ứng khác. Trong đó có một hiệu ứng liên quan mật thiết đến các bài giảng sau này của chúng ta, gọi là "hiệu ứng ưu tiên" (Precedence Effect) (còn gọi là "hiệu ứng Haas"). Từ thực nghiệm biết được, khi hai âm thanh giống nhau, một âm bị trễ, lần lượt đến hai tai chúng ta, nếu thời gian trễ trong vòng 30ms, thì con người sẽ không cảm nhận được sự tồn tại của âm bị trễ, chỉ có thể nhận thấy sự thay đổi về âm sắc và độ lớn. Nhưng nếu thời gian trễ quá dài, tình hình sẽ khác. Mọi người đều đã biết, khi chênh lệch thời gian giữa hai âm thanh đến trước sau vượt quá 50ms-60ms (tương đương chênh lệch quãng đường âm thanh lớn hơn 17m), người nghe có thể cảm nhận được.