Design von tragbaren Kommunikationsgeräten basierend auf Mini-Array-Mikrofontechnologie
Die räumlichen Beschränkungen in der Struktur tragbarer Produkte nehmen immer mehr zu. Lautsprecher werden kleiner, geforderte Lautstärken größer. Die Unterdrückung verschiedenster Geräusche und Echos (lineare und nichtlineare Echos bei Freisprech-Videotelefonie) sowie die Realisierung klarer Sprachkommunikation in lauter Umgebung sind zu lösende Herausforderungen.
Der von der US-Firma ForteMedia entwickelte FM2010-Chip basiert auf der patentierten Mini-Array-Mikrofontechnologie (SAM). Es handelt sich um einen Single-Chip mit niedrigem Stromverbrauch und niedrigen Kosten, der raumliche Filtertechniken, Richtungserkennung von Schallsignalen über große/kurze Entfernungen, Unterdrückung von akustischem Rauschen und Eliminierung von akustischem Echo verwendet. Dieser Artikel stellt die wesentlichen Designaspekte der SAM-Technologie in tragbaren Kommunikationsgeräten, die Hauptfunktionen des FM2010-Chips und dessen typische Anwendung in GSM-Handys vor.
Wesentliche Designaspekte der Mini-Array-Mikrofontechnologie
Die SAM-Technologie kann zwei Mikrofone verwenden: ein Uni-MIC (Hauptmikrofon) und ein Omni-MIC (Referenzmikrofon), die zusammen das Mini-Array-Mikrofon bilden. Diese werden Rücken-an-Rücken oder Seite-an-Seite platziert. Durch Ausnutzung der Unterschiede in ihren physikalischen Eigenschaften und nach der Verarbeitung durch den FM2010-Chip entsteht ein konischer Aufnahmekeil (Pickup-Lobe), der einen räumlichen Filter bildet, um nicht-stationäres Rauschen zu unterdrücken. Die Eigenschaften der Mikrofone, das Strukturdesign und die Parametereinstellung des FM2010 bestimmen Richtung, Winkel des konischen Aufnahmekeils und die Effektivität der Unterdrückung nicht-stationären Rauschens.
1 Mikrofonauswahl
Es wird empfohlen, 4mm Uni- und Omni-Mikrofone zu verwenden. Das Uni-MIC sollte eine Empfindlichkeit von -40dB ±3dB aufweisen; der Frequenzgang sollte bei 300Hz einen Abfall von weniger als 8,5dB und bei 3,4kHz einen Anstieg von weniger als 3,5dB zeigen; die Richtcharakteristik sollte nierenförmig sein, mit einem Empfindlichkeitsunterschied von >4dB zwischen 0° und 90° und >10dB zwischen 0° und 180°. Das Omni-MIC sollte eine Empfindlichkeit von -40dB ±1,5dB haben; der Frequenzgang sollte zwischen 300Hz und 3,4kHz flach sein. Empfohlen werden das Uni-Mikrofon B4015UL403 und das Omni-Mikrofon B4015AL-398 von IEA (Weifang Yilida), Shandong.
2 Strukturdesign
Schlüsselaspekte im Strukturdesign sind der Erhalt der Uni-Mikrofoneigenschaften und die Ausrichtung des konischen Aufnahmekeils. Bei Freisprechfunktion müssen zusätzlich Lautsprecher, Mikrofonentkopplung und Mikrofonabdichtung berücksichtigt werden. Die Richtung des konischen Aufnahmekeils bestimmt die Richtung, aus der nicht-stationäres Rauschen unterdrückt wird. Daher muss sichergestellt werden, dass das Nutzsignal innerhalb des Keils liegt, da es sonst als Rauschen unterdrückt wird. Bei der Produktgehäuseauslegung muss daher die Ausrichtung des Uni-Mikrofons sorgfältig berücksichtigt werden. Das Strukturdesign muss gewährleisten, dass das Uni-Mikrofon nach dem Einbau in die Mikrofonhülse und das gesamte Gehäuse einen Empfindlichkeitsunterschied von >6dB zwischen 0° und 180° aufweist und dass Empfindlichkeit und Frequenzcharakteristik im Wesentlichen unverändert bleiben. Mikrofonentkopplung kann nichtlineares Echo reduzieren; Abdichtung kann lineares Echo verringern und das Signal-Echo-Verhältnis des Systems verbessern.
3 Das nach der FM2010-Verarbeitung ausgegebene Signal
Abbildung 4 zeigt einen Vergleich der vom Mini-Array-Mikrofon aufgenommenen Signale und der nach der Verarbeitung durch den FM2010 ausgegebenen Signale. Die Schallquelle befindet sich 0,3m vom Mini-Array-Mikrofon entfernt bei einer Schallintensität von 83dB (SPL). Die Testsignale sind: Uni-Mikrofon bei 0° und 180°, Omni-Mikrofon bei 0° und 180°, Leitungsausgang (Lout) – das vom Mini-Array-Mikrofon bei 0° und 180° aufgenommene Signal nach FM2010-Verarbeitung. Abbildung 4 zeigt, dass Signale gleicher Stärke innerhalb (0°) und außerhalb (180°) des Aufnahmekeils eine Differenz von 20dB in der endgültigen Ausgabe aufweisen können. Das bedeutet, dass nicht-stationäres Rauschen außerhalb des Aufnahmekeils um 20dB relativ zum Nutzsignal unterdrückt wird. Der effektive Wirkungsbereich des konischen SAM-Aufnahmekeils beträgt 2m. Der Winkel des konischen Aufnahmekeils hängt von der Richtcharakteristik des Uni-Mikrofons und der Parametereinstellung des FM2010 ab.
Die von Uni- und Omni-Mikrofon aufgenommenen Signale werden durch einen programmierbaren Verstärker (PGA) verstärkt, analog-digital gewandelt (ADC) und hochpassgefiltert (HPF), bevor sie zur Verarbeitung an den Sprachprozessor gesendet werden (lineare Echokompensation, nichtlineare Echokompensation, VAD-Erkennung, Rauschunterdrückung, Mikrofonlautstärkeeinstellung). Die verarbeiteten Sprachdaten werden digital-analog gewandelt (DAC) und das Mikrofonsignal wird als unsymmetrisches Signal vom Leitungsausgang (LOUT) an den Mikrofoneingang (MICIP/MIC1N) des analogen Basisbandprozessors TWL3014/16 gesendet. Nach Verarbeitung in der Uplink-Strecke wird es an den digitalen Basisbandprozessor OMAP733/750 weitergeleitet. Das vom GSM-Handy empfangene Signal wird demoduliert, durch den digitalen Basisbandprozessor OMAP733/750 kanaldecodiert und entschlüsselt. Das resultierende digitale Audiosignal wird an den analogen Basisbandprozessor TWL3014/16 gesendet, in der Downlink-Strecke verarbeitet und vom Hörer (HSO) und Kopfhörer (EARP/EARN) ausgegeben – ein Pfad zum Hörer, ein Pfad zu einem externen Verstärker, der den Freisprechlautsprecher antreibt. Gleichzeitig werden beide Signale an die Liniengängeingänge des FM2010 gesendet, ADC- und HPF-gewandelt in Sprachdaten, und als Echoreferenzsignale an den Sprachprozessor gesendet.
Steuerablauf des OMAP733/750 für den FM2010: Die Steuerung des FM2010 erfolgt über die SHI-Schnittstelle und die Steuerpins PWD, RESET, ANA_IRQ. Nach dem Einschalten des Geräts wird zunächst PWD hochgesetzt, ANA_IRQ tiefgesetzt. Nach einem Reset werden Parameter an den FM2010 gesendet (hauptsächlich Taktquelle, Taktfrequenz, DSP-Arbeitsgeschwindigkeit). Anschließend wird der Chip in den Stromsparmodus versetzt. Wie in Abbildung 8 dargestellt, wird der FM2010 basierend auf dem Anrufmodus (eingehend, ausgehend oder Aufnahme) aufgeweckt. Nach dem Reset werden entsprechend des Handheld-/Freisprechmodus die entsprechenden Modusparameter an den FM2010 gesendet. Für den Handheld-Rauschunterdrückungsmodus müssen Anzahl der Mikrofone, Mikrofonverstärkung, Mikrofonlautstärke, Echokompensationsparameter und VAD-Parameter übermittelt werden. Für den Freisprech-Konferenzmodus müssen Anzahl der Mikrofone, Mikrofonverstärkung, Mikrofonlautstärke, Mikrofoninvertierung und Echokompensationsparameter (hauptsächlich für leises, normales und lautes Sprechen des Gegenübers) gesendet werden. Die Einstellung des Freisprech-Personalmodus ähnelt weitgehend dem Handheld-Rauschunterdrückungsmodus, erfordert jedoch mehr Anpassungen der Echokompensationsparameter. Nach Gesprächsende wird der CODEC des FM2010 deaktiviert und der FM2010 in den Stromsparmodus versetzt. Wie in Abbildung 9 dargestellt, dient der GSM-Handy-Audiotestmodus hauptsächlich Testzwecken. Im Testmodus arbeitet der FM2010 im Durchgangsmodus (Bypass), wobei der interne DSP keine Verarbeitung der Mikrofoneingangssignale vornimmt. Das Eingangssignal des Uni-Mikrofons wird durch den PGA verstärkt und direkt vom LOUT-Verstärker ausgegeben. Über die SHI-Schnittstelle können die Parameter des Mikrofonverstärkers und des LOUT-Verstärkers online eingestellt werden.
Der von der US-Firma ForteMedia entwickelte FM2010-Chip basiert auf der patentierten Mini-Array-Mikrofontechnologie (SAM). Es handelt sich um einen Single-Chip mit niedrigem Stromverbrauch und niedrigen Kosten, der raumliche Filtertechniken, Richtungserkennung von Schallsignalen über große/kurze Entfernungen, Unterdrückung von akustischem Rauschen und Eliminierung von akustischem Echo verwendet. Dieser Artikel stellt die wesentlichen Designaspekte der SAM-Technologie in tragbaren Kommunikationsgeräten, die Hauptfunktionen des FM2010-Chips und dessen typische Anwendung in GSM-Handys vor.
Wesentliche Designaspekte der Mini-Array-Mikrofontechnologie
Die SAM-Technologie kann zwei Mikrofone verwenden: ein Uni-MIC (Hauptmikrofon) und ein Omni-MIC (Referenzmikrofon), die zusammen das Mini-Array-Mikrofon bilden. Diese werden Rücken-an-Rücken oder Seite-an-Seite platziert. Durch Ausnutzung der Unterschiede in ihren physikalischen Eigenschaften und nach der Verarbeitung durch den FM2010-Chip entsteht ein konischer Aufnahmekeil (Pickup-Lobe), der einen räumlichen Filter bildet, um nicht-stationäres Rauschen zu unterdrücken. Die Eigenschaften der Mikrofone, das Strukturdesign und die Parametereinstellung des FM2010 bestimmen Richtung, Winkel des konischen Aufnahmekeils und die Effektivität der Unterdrückung nicht-stationären Rauschens.
1 Mikrofonauswahl
Es wird empfohlen, 4mm Uni- und Omni-Mikrofone zu verwenden. Das Uni-MIC sollte eine Empfindlichkeit von -40dB ±3dB aufweisen; der Frequenzgang sollte bei 300Hz einen Abfall von weniger als 8,5dB und bei 3,4kHz einen Anstieg von weniger als 3,5dB zeigen; die Richtcharakteristik sollte nierenförmig sein, mit einem Empfindlichkeitsunterschied von >4dB zwischen 0° und 90° und >10dB zwischen 0° und 180°. Das Omni-MIC sollte eine Empfindlichkeit von -40dB ±1,5dB haben; der Frequenzgang sollte zwischen 300Hz und 3,4kHz flach sein. Empfohlen werden das Uni-Mikrofon B4015UL403 und das Omni-Mikrofon B4015AL-398 von IEA (Weifang Yilida), Shandong.
2 Strukturdesign
Schlüsselaspekte im Strukturdesign sind der Erhalt der Uni-Mikrofoneigenschaften und die Ausrichtung des konischen Aufnahmekeils. Bei Freisprechfunktion müssen zusätzlich Lautsprecher, Mikrofonentkopplung und Mikrofonabdichtung berücksichtigt werden. Die Richtung des konischen Aufnahmekeils bestimmt die Richtung, aus der nicht-stationäres Rauschen unterdrückt wird. Daher muss sichergestellt werden, dass das Nutzsignal innerhalb des Keils liegt, da es sonst als Rauschen unterdrückt wird. Bei der Produktgehäuseauslegung muss daher die Ausrichtung des Uni-Mikrofons sorgfältig berücksichtigt werden. Das Strukturdesign muss gewährleisten, dass das Uni-Mikrofon nach dem Einbau in die Mikrofonhülse und das gesamte Gehäuse einen Empfindlichkeitsunterschied von >6dB zwischen 0° und 180° aufweist und dass Empfindlichkeit und Frequenzcharakteristik im Wesentlichen unverändert bleiben. Mikrofonentkopplung kann nichtlineares Echo reduzieren; Abdichtung kann lineares Echo verringern und das Signal-Echo-Verhältnis des Systems verbessern.
3 Das nach der FM2010-Verarbeitung ausgegebene Signal
Abbildung 4 zeigt einen Vergleich der vom Mini-Array-Mikrofon aufgenommenen Signale und der nach der Verarbeitung durch den FM2010 ausgegebenen Signale. Die Schallquelle befindet sich 0,3m vom Mini-Array-Mikrofon entfernt bei einer Schallintensität von 83dB (SPL). Die Testsignale sind: Uni-Mikrofon bei 0° und 180°, Omni-Mikrofon bei 0° und 180°, Leitungsausgang (Lout) – das vom Mini-Array-Mikrofon bei 0° und 180° aufgenommene Signal nach FM2010-Verarbeitung. Abbildung 4 zeigt, dass Signale gleicher Stärke innerhalb (0°) und außerhalb (180°) des Aufnahmekeils eine Differenz von 20dB in der endgültigen Ausgabe aufweisen können. Das bedeutet, dass nicht-stationäres Rauschen außerhalb des Aufnahmekeils um 20dB relativ zum Nutzsignal unterdrückt wird. Der effektive Wirkungsbereich des konischen SAM-Aufnahmekeils beträgt 2m. Der Winkel des konischen Aufnahmekeils hängt von der Richtcharakteristik des Uni-Mikrofons und der Parametereinstellung des FM2010 ab.
Die von Uni- und Omni-Mikrofon aufgenommenen Signale werden durch einen programmierbaren Verstärker (PGA) verstärkt, analog-digital gewandelt (ADC) und hochpassgefiltert (HPF), bevor sie zur Verarbeitung an den Sprachprozessor gesendet werden (lineare Echokompensation, nichtlineare Echokompensation, VAD-Erkennung, Rauschunterdrückung, Mikrofonlautstärkeeinstellung). Die verarbeiteten Sprachdaten werden digital-analog gewandelt (DAC) und das Mikrofonsignal wird als unsymmetrisches Signal vom Leitungsausgang (LOUT) an den Mikrofoneingang (MICIP/MIC1N) des analogen Basisbandprozessors TWL3014/16 gesendet. Nach Verarbeitung in der Uplink-Strecke wird es an den digitalen Basisbandprozessor OMAP733/750 weitergeleitet. Das vom GSM-Handy empfangene Signal wird demoduliert, durch den digitalen Basisbandprozessor OMAP733/750 kanaldecodiert und entschlüsselt. Das resultierende digitale Audiosignal wird an den analogen Basisbandprozessor TWL3014/16 gesendet, in der Downlink-Strecke verarbeitet und vom Hörer (HSO) und Kopfhörer (EARP/EARN) ausgegeben – ein Pfad zum Hörer, ein Pfad zu einem externen Verstärker, der den Freisprechlautsprecher antreibt. Gleichzeitig werden beide Signale an die Liniengängeingänge des FM2010 gesendet, ADC- und HPF-gewandelt in Sprachdaten, und als Echoreferenzsignale an den Sprachprozessor gesendet.
Steuerablauf des OMAP733/750 für den FM2010: Die Steuerung des FM2010 erfolgt über die SHI-Schnittstelle und die Steuerpins PWD, RESET, ANA_IRQ. Nach dem Einschalten des Geräts wird zunächst PWD hochgesetzt, ANA_IRQ tiefgesetzt. Nach einem Reset werden Parameter an den FM2010 gesendet (hauptsächlich Taktquelle, Taktfrequenz, DSP-Arbeitsgeschwindigkeit). Anschließend wird der Chip in den Stromsparmodus versetzt. Wie in Abbildung 8 dargestellt, wird der FM2010 basierend auf dem Anrufmodus (eingehend, ausgehend oder Aufnahme) aufgeweckt. Nach dem Reset werden entsprechend des Handheld-/Freisprechmodus die entsprechenden Modusparameter an den FM2010 gesendet. Für den Handheld-Rauschunterdrückungsmodus müssen Anzahl der Mikrofone, Mikrofonverstärkung, Mikrofonlautstärke, Echokompensationsparameter und VAD-Parameter übermittelt werden. Für den Freisprech-Konferenzmodus müssen Anzahl der Mikrofone, Mikrofonverstärkung, Mikrofonlautstärke, Mikrofoninvertierung und Echokompensationsparameter (hauptsächlich für leises, normales und lautes Sprechen des Gegenübers) gesendet werden. Die Einstellung des Freisprech-Personalmodus ähnelt weitgehend dem Handheld-Rauschunterdrückungsmodus, erfordert jedoch mehr Anpassungen der Echokompensationsparameter. Nach Gesprächsende wird der CODEC des FM2010 deaktiviert und der FM2010 in den Stromsparmodus versetzt. Wie in Abbildung 9 dargestellt, dient der GSM-Handy-Audiotestmodus hauptsächlich Testzwecken. Im Testmodus arbeitet der FM2010 im Durchgangsmodus (Bypass), wobei der interne DSP keine Verarbeitung der Mikrofoneingangssignale vornimmt. Das Eingangssignal des Uni-Mikrofons wird durch den PGA verstärkt und direkt vom LOUT-Verstärker ausgegeben. Über die SHI-Schnittstelle können die Parameter des Mikrofonverstärkers und des LOUT-Verstärkers online eingestellt werden.