MP3

概述

MP3的含义：1.指一种音乐格式.

2.指能播放MP3音乐文件的播放器.

MP3全称是Moving Picture Experts Group Audio Layer III。是当今较流行的一种数字音频编码和有损压缩格式，它设计用来大幅度地降低音频数据量，而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

简单的说，MP3就是一种音频压缩技术，由于这种压缩方式的全称叫MPEG Audio Layer3，所以人们把它简称为MP3。MP3是利用 MPEG Audio Layer 3 的技术，将音乐以1:10 甚至 1:12 的压缩率，压缩成容量较小的file，换句话说，能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体积小，音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小，这样每首歌的大小只有3-4兆字节。使用MP3播放器对MP3文件进行实时的解压缩（解码），这样，高品质的MP3音乐就播放出来了。

MP3是一个数据压缩格式。它丢弃掉脉冲编码调制（PCM）音频数据中对人类听觉不重要的数据（类似于JPEG是一个有损图像压缩），从而达到了小得多的文件大小。

在MP3中使用了许多技术其中包括心理声学以确定音频的哪一部分可以丢弃。MP3音频可以按照不同的位速进行压缩，提供了在数据大小和声音质量之间进行权衡的一个范围。

根据MPEG规范的说法，MPEG-4中的AAC（Advanced audio coding）将是MP3格式的下一代，尽管有许多创造和推广其他格式的重要努力。然而，由于MP3的空前的流行，任何其他格式的成功在目前来说都是不太可能的。MP3不仅有广泛的用户端软件支持，也有很多的硬件支持比如便携式媒体播放器（指MP3播放器）DVD和CD播放器。MP3的播放跟DVD不一样。

MP3格式特点

1.MP3是一个数据压缩格式。

2.它丢弃掉脉冲编码调制（PCM）音频数据中对人类听觉不重要的数据（类似于JPEG是一个有损图像压缩），从而达到了小得多的文件大小。

3.MP3音频可以按照不同的位速进行压缩，提供了在数据大小和声音质量之间进行权衡的一个范围。MP3格式使用了混合的转换机制将时域信号转换成频域信号。

4.32波段多相积分滤波器（PQF）。

5.36或者12 tap 改良离散余弦滤波器（MDCT）；每个子波段大小可以在0...1和2...31之间独立选择。

6.MP3不仅有广泛的用户端软件支持，也有很多的硬件支持比如便携式媒体播放器（指MP3播放器）DVD和CD播放器。

mp3发展历程

MPEG-1 Audio Layer 2编码开始时是德国Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt（后来称为Deutsches Zentrum für Luft- und Raumfahrt，德国太空中心）Egon Meier-Engelen管理的数字音频广播（DAB）项目。这个项目是欧盟作为EUREKA研究项目资助的，它的名字通常称为EU-147。EU-147 的研究期间是1987年到1994年。

到了1991年，就已经出现了两个提案：Musicam（称为Layer 2）和ASPEC（自适应频谱感知熵编码）。荷兰飞利浦公司、法国CCETT和德国Institut für Rundfunktechnik提出的Musicam方法由于它的简单、出错时的健壮性以及在高质量压缩时较少的计算量而被选中。基于子带编码的Musicam 格式是确定MPEG音频压缩格式（采样率、帧结构、数据头、每帧采样点）的一个关键因素。这项技术和它的设计思路完全融合到了ISO MPEG Audio Layer I、II 以及后来的Layer III（MP3）格式的定义中。在Mussmann教授（University of Hannover）的主持下，标准的制定由Leon van de Kerkhof（Layer I）和Gerhard Stoll（Layer II）完成。

一个由荷兰Leon Van de Kerkhof、德国Gerhard Stoll、法国Yves-François Dehery和德国Karlheinz Brandenburg 组成的工作小组吸收了Musicam和ASPEC的设计思想，并添加了他们自己的设计思想从而开发出了MP3，MP3能够在128kbit/s达到MP2 192kbit/s 音质。

所有这些算法最终都在1992年成为了MPEG的第一个标准组MPEG-1的一部分，并且生成了1993年公布的国际标准ISO/IEC 11172-3。MPEG音频上的更进一步的工作最终成为了1994年制定的第二个MPEG标准组MPEG-2标准的一部分，这个标准正式的称呼是1995年首次公布的ISO/IEC 13818-3。

编码器的压缩效率通常由位速定义，因为压缩率依赖于位数（:en:bit depth）和输入信号的采样率。然而，经常有产品使用CD参数（44.1kHz、两个通道、每通道16位或者称为2x16位）作为压缩率参考，使用这个参考的压缩率通常较高，这也说明了压缩率对于有损压缩存在的问题。

Karlheinz Brandenburg使用CD介质的Suzanne Vega的歌曲Tom’s Diner来评价MP3压缩算法。使用这首歌是因为这首歌的柔和、简单旋律使得在回放时更容易听到压缩格式中的缺陷。一些人开玩笑地将Suzanne Vega称为“MP3之母”。来自于EBU V3/SQAM参考CD的更多一些严肃和critical 音频选段(glockenspiel，triangle，accordion...)被专业音频工程师用来评价MPEG音频格式的主观感受质量。

MP3走向大众

为了生成位兼容的MPEG Audio文件（Layer 1、Layer 2、Layer 3），ISO MPEG Audio委员会成员用C语言开发的一个称为ISO 11172-5的参考模拟软件。在一些非实时操作系统上它能够演示第一款压缩音频基于DSP的实时硬件解码。一些其它的MPEG Audio实时开发出来用于面向消费接收机和机顶盒的数字广播（无线电DAB和电视DVB）。

后来，1994年7月7日Fraunhofer-Gesellschaft发布了第一个称为l3enc的MP3编码器。

Fraunhofer开发组在1995年7月14日选定扩展名.mp3（以前扩展名是.bit）。使用第一款实时软件MP3播放器Winplay3（1995年9月9日发布）许多人能够在自己的个人电脑上编码和回放MP3文件。由于当时的硬盘相对较小（如500MB），这项技术对于在计算机上存储娱乐音乐来说是至关重要的。

MP2、MP3与因特网

1993年10月，MP2(MPEG-1 Audio Layer 2)文件在因特网上出现，它们经常使用Xing MPEG Audio Player播放，后来又出现了Tobias Bading为Unix开发的MAPlay。MAPlay于199年2月22日首次发布，现在已经移植到微软视窗平台上。

刚开始仅有的MP2编码器产品是Xing Encoder和CDDA2WAV，CDDA2WAV是一个将CD音轨转换成WAV格式的CD抓取器。

Internet Underground Music Archive（IUMA）通常被认为是在线音乐革命的鼻祖，IUMA是因特网上第一个高保真音乐网站，在MP3和网络流行之前它有数千首授权的MP2录音。

从1995年上半年开始直到整个九十年代后期，MP3开始在因特网上蓬勃发展。MP3的流行主要得益于如Nullsoft于1997年发布的Winamp和Napster于1999年发布的Napster这样的公司和软件包的成功，并且它们相互促进发展。这些程序使得普通用户很容易地播放、制作、共享和收集MP3文件。

关于MP3文件的点对点技术文件共享的争论在最近几年迅速蔓延—这主要是由于压缩使得文件共享成为可能，未经压缩的文件过于庞大难于共享。由于MP3文件通过因特网大量传播一些主要唱片厂商通过法律起诉Napster来保护它们的版权（参见知识产权）。

如iTunes Music Store这样的商业在线音乐发行服务通常选择其它或者专有的支持数字版权管理（DRM）的音乐文件格式以控制和限制数字音乐的使用。支持DRM的格式的使用是为了防止受版权保护的素材免被侵犯版权，但是大多数的保护机制都能被一些方法破解。这些方法能够被计算机高手用来生成能够自由复制的解锁文件。一个显著的例外是微软公司的Windows Media Audio 10格式，目前它还没有被破解。如果希望得到一个压缩的音频文件，这个录制的音频流必须进行压缩并且带来音质的降低。

MP3的音频质量

因为MP3是一种有损格式，它提供了多种不同“位速”的选项—也就是用来表示每秒音频所需的编码数据位数。典型的速度介于每秒128和320kb之间。与此对照的是，CD上未经压缩的音频位速是1411.2 kbit/s（16 位/采样点 × 44100 采样点/秒 × 2 通道)。

使用较低位速编码的MP3文件通常回放质量较低。使用过低的位速，“压缩噪声（：en：compression artifact）”（原始录音中没有的声音）将会在回放时出现。说明压缩噪声的一个好例子是压缩欢呼的声音：由于它的随机性和急剧变化，所以编码器的错误就会更明显，并且听起来就象回声。

除了编码文件的位速之外，MP3文件的质量也与编码器的质量以及编码信号的难度有关。使用优质编码器编码的普通信号，一些人认为128kbit/s的MP3以及44.1kHz的CD采样的音质近似于CD音质，同时得到了大约11:1的压缩率。在这个比率下正确编码的MP3能够获得比调频广播和卡式磁带[来源请求]更好的音质，这主要是那些模拟介质的带宽限制、信噪比和其它一些限制。然而，听力测试显示经过简单的练习测试听众能够可靠地区分出128kbit/s MP3与原始CD的区别[来源请求]。在许多情况下他们认为MP3音质太低是不可接受的，然而其他一些听众或者换个环境（如在嘈杂的车中或者聚会上）他们又认为音质是可接受的。很显然，MP3 编码的瑕疵在低端计算机的扬声器上比较不明显，而在连接到计算机的高质量立体声系统，尤其是使用高质量的headphone时则比较明显。

Fraunhofer Gesellschaft（FhG）在他们的官方网站上公布了下面的MPEG-1 Layer 1、2和3的压缩率和数据速率用于比较：

⊙ Layer 1: 384 kbit/s，压缩率 4:1

⊙ Layer 2: 192...256 kbit/s，压缩率 8:1...6:1

⊙ Layer 3: 112...128 kbit/s，压缩率 12:1...10:1

不同层面之间的差别是因为它们使用了不同的心理声学模型导致的；Layer 1的算法相当简单，所以透明编码就需要更高的位速。然而，由于不同的编码器使用不同的模型，很难进行这样的完全比较。

许多人认为所引用的速率出于对Layer 2和Layer 3记录的偏爱而出现了严重扭曲。他们争辩说实际的速率如下所列：

* Layer 1: 384 kbit/s 优秀。

* Layer 2: 256...384 kbit/s 优秀，224...256 kbit/s 很好，192...224 kbit/s 好。

* Layer 3: 224...320 kbit/s 优秀，192...224 kbit/s 很好，128...192 kbit/s 好。

当比较压缩机制时，很重要的是要使用同等音质的编码器。将新编码器与基于过时技术甚至是带有缺陷的旧编码器比较可能会产生对于旧格式不利的结果。由于有损编码会丢失信息这样一个现实，MP3算法通过建立人类听觉总体特征的模型尽量保证丢弃的部分不被人耳识别出来（例如，由于noise masking），不同的编码器能够在不同程度上实现这一点。

一些可能的编码器：

* Mike Cheng在1998年早些时候首次开发的LAME。与其它相比，它是一个完全遵循LGPL的MP3编码器，它有良好的速度和音质，甚至对MP3技术的后继版本形成了挑战。

* Fraunhofer Gesellschaft：有些编码器不错，有些有缺陷。

有许多的早期编码器现在已经不再广泛使用：

* ISO dist10 参考代码

* Xing

* BladeEnc

* ACM Producer Pro.

好的编码器能够在128到160kbit/s下达到可接受的音质，在160到192kbit/s下达到接近透明的音质。所以不在特定编码器或者最好的编码器话题内说128kbit/s或者192kbit/s下的音质是容易引起误解的。一个好的编码器在 128kbit/s下生成的MP3有可能比一个不好的编码器在192kbit/s下生成的MP3音质更好。另外，即使是同样的编码器同样的文件大小，一个不变位速的MP3可能比一个变位速的MP3音质要差很多。

需要注意的一个重要问题是音频信号的质量是一个主观判断。Placebo effect is rampant，with many users claiming to require a certain quality level for transparency。许多用户在A/B测试中都没有通过，他们无法在更低的位速下区分文件。一个特定的位速对于有些用户来说是足够的，对于另外一些用户来说是不够的。每个人的声音感知可能有所不同，所以一个能够满足所有人的特定心理声学模型并不明显存在。仅仅改变试听环境，如音频播放系统或者环境可能就会显现出有损压缩所产生的音质降低。上面给出的数字只是大多数人的一个大致有效参考，但是在有损压缩领域真正有效的压缩过程质量测试手段就是试听音频结果。

如果你的目标是实现没有质量损失的音频文件或者用在演播室中的音频文件，就应该使用无损压缩算法，目前能够将16位PCM音频数据压缩到38%并且声音没有任何损失，这样的压缩工具有Lossless Audio LA、Apple Lossless、TTA、FLAC、Windows Media Audio 9 Lossless (wma) 和Monkey’s Audio 等等。对于需要进行编辑、混合处理的音频文件要尽量使用无损格式，否则有损压缩产生的误差可能在处理后无法预测,多次编码产生的损失将会混杂在一起，在处理之后进行编码这些损失将会变得更加明显。无损压缩在降低压缩率的代价下能够达到最好的结果。

一些简单的编辑操作，如切掉音频的部分片段，可以直接在MP3数据上操作而不需要重新编码。对于这些操作来说，只要使用合适的软件（mp3DirectCut和MP3Gain），上面提到的所关心的问题可以不必考虑。

位速

位速对于MP3文件来说是可变的。总的原则是位速越高则声音文件中包含的原始声音信息越多，这样回放时声音质量也越高。在MP3编码的早期，整个文件使用一个固定的位速。

MPEG-1 Layer 3允许使用的位速是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s，允许的采样频率是32、44.1和48kHz。44.1kHz是最为经常使用的速度（与CD的采样速率相同），128kbit/s是事实上“好品质”的标准，尽管192kbit/s在对等文件共享网络上越来越受到欢迎。MPEG-2和[非正式的]MPEG-2.5包括其它一些位速：6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。

可变位速（VBR）也是可能的。MP3文件的中的音频切分成有自己不同位速的帧，这样在文件编码的时候就可以动态地改变位速。尽管在最初的实现中并没有这项功能，VBR现在已经得到了广泛的应用。这项技术使得在声音变化大的部分使用较大的位速而在声音变化小的部分使用较小的位速成为可能。这个方法类似于声音控制的磁带录音机不记录静止部分节省磁带消耗。一些编码器在很大程度上依赖于这项技术。

高达640kbit/s的非标准位速可以使用LAME编码器和自由格式来实现，但是几乎没有MP3播放器能够播放这些文件。

MP3的设计局限

MP3格式有一些不能仅仅通过使用更好的编码器绕过的内在限制。一些新的压缩格式如Vorbis和AAC不再有这些限制。

按照技术术语，MP3有如下一些限制：

* 位速最大是320 kbit/s；

* 时间分辨率相对于变化迅速的信号来说太低；

* 对于超过15.5/15.8 kHz的频率没有scale factor band；

* Joint stereo 是基于帧与帧完成的；

* 没有定义编码器/解码器的整体时延，这就意味着gapless playback缺少一个正式的规定；

然而，即使有这些限制，一个好好的调整MP3编码器能够非常有竞争力地完成编码任务。

MP3音频编码

MPEG-1标准中没有MP3编码器的一个精确规范，然而与此相反，解码算法和文件格式却进行了细致的定义。人们设想编码的实现是设计自己的适合去除原始音频中部分信息的算法（或者是它在频域中的修正离散余弦（MDCT）表示）。在编码过程中，576个时域样本被转换成576个频域样本，如果是瞬变信号就使用192而不是576个采样点，这是限制量化噪声随着随瞬变信号短暂扩散。

这是听觉心理学的研究领域：人类主观声音感知。

这样带来的结果就是出现了许多不同的MP3编码器，每种生成的声音质量都不相同。有许多它们的比较结果，这样一个潜在用户很容易选择合适的编码器。需要记住的是高位速编码表现优秀的编码器（如LAME这个在高位速广泛使用的编码器）未必在低位速的表现也同样好。

MP3音频解码

另一方面，解码在标准中进行了细致的定义。

多数解码器是bitstream compliant，也就是说MP3文件解码出来的非压缩输出信号将与标准文档中数学定义的输出信号一模一样（在规定的近似误差范围内）。

MP3文件有一个标准的格式，这个格式就是包括384、576、或者1152个采样点（随MPEG的版本和层不同而不同）的帧，并且所有的帧都有关联的头信息（32位）和辅助信息（9、17或者32字节，随着MPEG版本和立体声或者单通道的不同而不同）。头和辅助信息能够帮助解码器正确地解码相关的霍夫曼编码数据。所以，大多数的解码器比较几乎都是完全基于它们的计算效率（例如，它们在解码过程中所需要的内存或者CPU时间）。

ID3和其它标签

“标签”是MP3（或其它格式）中保存的包含如标题、艺术家、唱片、音轨号或者其它关于MP3文件信息等添加到文件的数据。最为流行的标准标签格式目前是ID3 ID3v1和ID3v2标签，最近的是APEv2标签。

APEv2最初是为MPC 文件格式开发的（参见 APEv2规范）。APEv2可以与ID3标签在同一个文件中共存，但是它也可以单独使用。

音量归一化（normalization）

由于CD和其它各种各样的音源都是在不同的音量下录制的，在标签中保存文件的音量信息将是有用的，这样的话回放时音量能够进行动态调节。

人们已经提出了一些对MP3文件增益进行编码的标准。它们的设计思想是对音频文件的音量（不是“峰值”音量）进行归一化，这样以保证在不同的连续音轨切换时音量不会有变化。

最流行最常用的保存回放增益的解决方法是被简单地称作“Replay Gain”的方法。音轨的音量平均值和修剪信息都存在元数据标签中。

可选技术

有许多其它的有损音频编解码存在，其中包括：

* MPEG-1/2 Audio Layer 2 (MP2)，MP3的前辈；

* MPEG-4 AAC, MP3的继承者，Apple的iTunes Music Store和iPod使用；

* Xiph.org Foundation的Ogg Vorbis，自由软件和没有专利的编解码器；

* MPC，也称作Musepack（以前叫MP+），由MP2派生出来；

* Thomson Multimedia的MP3和SBR的组合mp3PRO；

* AC-3，Dolby Digital和DVD中使用；

* ATRAC，Sony的Minidisc使用；

* Windows Media Audio（WMA）来自于微软公司；

* QDesign, 用于低速QuickTime；

* AMR-WB+ 针对蜂窝电话和其它有限带宽使用进行了优化的增强自适应多速宽带编解码器；（Enhanced Adaptive Multi Rate WideBand codec）；

* RealNetworks的RealAudio，经常用于网站的流媒体；

* Speex，基于CELP的专门为语音和VoIP设计的自由软件和无专利编解码器。

mp3PRO、MP3、AAC、和MP2都是同一个技术家族中的成员，并且都是基于大致类似的心里声学模型。Fraunhofer Gesellschaft拥有许多涵盖这些编解码器所用技术的基本专利，Dolby Labs、索尼公司、Thomson Consumer Electronics和AT&T拥有其它一些关键专利。

在因特网上有一些其它无损音频压缩方法。尽管它们与MP3不同，它们是其它压缩机制的优秀范例，它们包括：

* FLAC 表示‘自由无损音频编解码（Free Lossless Audio Codec）’

* Monkey’s Audio

* SHN，也称为Shorten

* TTA

* Wavpack

* Apple Lossless

听觉测试试图找出特定位速下的最好质量的有损音频编解码。在128kbit/s下，Ogg Vorbis、AAC、MPC和WMA Pro性能持平处于领先位置，LAME MP3稍微落后。在64kbit/s下，AAC-HE和mp3pro少许领先于其它编解码器。在超过128kbit/s下，多数听众听不出它们之间有明显差别。什么是“CD音质”也是很主观的：对于一些人来说128kbit/s的MP3就足够了，而对于另外一些人来说必须是200kbit/s以上的位速。

尽管如WMA和RealAudio这些新的编解码器的支持者宣称它们各自的算法能够在64kbit/s达到CD音质，听觉测试却显示了不同的结果；然而，这些编解码器在64kbit/s的音质明显超过同样位速下MP3的音质。无专利的Ogg Vorbis编解码器的开发者宣称它们的算法超过了MP3、RealAudio和WMA的音质，上面提到的听觉测试证实了这种说法。Thomson宣称它的mp3PRO 在64kbit/s达到了CD音质，但是测试者报告说64kbit/s的mp3Pro文件与112kbit/s的MP3文件音质类似，但是直到 80kbit/s时它才能接近CD音质。

专门为MPEG-1/2视频设计的、优化的MP3总体上在低于48kbit/s的单声道数据和低于80kbit/s的立体声上表现不佳。

授权和专利问题

Thomson Consumer Electronics在认可软件专利的国家控制着MPEG-1/2 Layer 3 专利的授权，这些国家包括美国和日本，欧盟国家不包括在内。Thomson积极地加强这些专利的保护。Thomson已经在欧盟国家被欧洲专利局（:en:European Patent Office授予软件专利，但是还不清楚它们是否会被那里的司法所加强。参见欧洲专利协定中的软件专利（:en:Software patents under the European Patent Convention）。

关于Thomson专利文件、授权协议和费用的最新信息请参考它们的网站mp3licensing.com。

在1998年9月，Fraunhofer Institute向几个MP3软件开发者发去了一封信声明“发布或者销售编码器或者解码器”需要授权。这封信宣称非经授权的产品“触犯了 Fraunhofer和THOMSON的专利权。制造、销售或者发布使用[MPEG Layer-3]标准或者我们专利的产品，你们需要从我们这里获得这些专利的授权协议。”

这些专利问题极大地减慢了未经授权的MP3软件开发并且导致人们的注意力转向开发和欢迎其它如WMA和Ogg Vorbis这样的替代品。Windows开发系统的制造商微软公司从MP3专向它们自有的Windows Media格式以避免与专利相关的授权问题。直到那些关键的专利过期之前，未经授权的编码器和播放器在认可软件专利的国家看起来都是非法的。

尽管有这些专利限制，永恒的MP3格式继续向前发展；这种现象的原因看起来是由如下因素带来的网络效应：

* 熟悉这种格式，不知道有其它可选格式存在，

* 这些可选格式没有普遍地明显超过MP3的优势这样一个现实，

* 大量的MP3格式音乐，

* 大量的使用这种格式的不同软件和硬件，

* 没有DRM保护技术，这使得MP3文件可以很容易地修改、复制和通过网络重新发布，

* 大多数家庭用户不知道或者不关心软件专利争端，通常这些争端与他们个人用途而选用MP3格式无关。

另外，专利持有人不愿对于开源解码器加强授权费用的征收，这也带来了许多免费MP3解码器的发展。另外，尽管他们试图阻止发布编码器的二进制代码， Thomson已经宣布使用免费MP3编码器的个人用户将不需要支付费用。这样，尽管专利费是许多公司打算使用MP3格式时需要考虑的问题，对于用户来说并没有什么影响，这就带来了这种格式的广受欢迎。

Sisvel S.p.A. [1]和它的美国子公司Audio MPEG, Inc. [2]以前曾经以侵犯MP3技术专利为由起诉Thomson[3]，但是那些争端在2005年11月最终以Sisvel给Thomson MP3授权而结束。Motorola最近也与Audio MPEG签署了MP3的授权协议。由于Thomson和Sisvel都拥有他们声称编解码器必需的单独的专利，MP3专利的法律状态还不清晰。

Fraunhofer的专利将在2010年4月到期，到了那时MP3算法将不再受专利保护。

MP3播放器

MP3播放器，全称MP3 player，顾名思义也就是可播放MP3格式的音乐播放工具，但一般的MP3播放器不仅仅只支持MP3格式，流行的一般还支持WMA WMV ASF WMV MPG等格式。

MP3播放器的压缩率可以达到1：12，但在人耳听起来，却并没有什么失真，因为它将超出人耳听力范围的声音从数字音频中去掉，而不改变最主要的声音。此外，MP3播放器也可以上传、下载其他任何格式的电脑文件，MP3播放器具有移动存储功能。

MP3播放器其实就是一个功能特定的小型电脑。在MP3播放器小小的机身里，拥有MP3播放器存储器（存储卡）、MP3播放器显示器（LCD显示屏）、MP3播放器中央处理器 [MCU（微控制器）或MP3播放器解码DSP（数字信号处理器）] 等。

世界上第一台MP3的诞生，其实是有一个小故事的，故事追溯到1997年3月的一天，韩国三星公司一位部门经理Moon先生，出差在美国回到汉城的飞机上，在他的笔记本电脑上看他的同事给他发出的一分报告。这是一份图象、文字和MP3音乐合成的简报。当Moon阅读完毕摘下耳机，发现他身旁的旅客正在听着MD，Moon顿时受到启发：要是电脑上的MP3音乐文件也能够直接取出来，用一个独立的播放器来播放，那不就是最好的音乐随身听吗？回到韩国后，他将这个想法提给当时的总裁尹钟龙。可惜的是，当时三星正在进行组织重整，无暇兼顾Moon的发展提案。半年后，亚洲金融风暴的发生使三星公司受到巨大的冲击，Moon先生也被迫提早退休。离开三星公司后，Moon先生进入了另一家韩国企业Saehan（世韩）出任总裁，并将他的想法在Saehan公司转变成为了现实，于1998年推出了世界上第一台的MP3播放器——MPMan F10。

MP3播放器解析

MP3播放器工作原理

MP3播放器是利用数字信号处理器DSP（Digital Sign Processer）来完成处理传输和解码MP3文件的任务的。DSP掌管随身听的数据传输，设备接口控制，文件解码回放等活动。DSP能够在非常短的时间里完成多种处理任务，而且此过程所消耗的能量极少（这也是它适合于便携式播放器的一个显著特点）。

首先将MP3歌曲文件从内存中取出并读取存储器上的信号→到解码芯片对信号进行解码→通过数模转换器将解出来的数字信号转换成模拟信号→再把转换后的模拟音频放大→低通滤波后到耳机输出口，输出后就是我们所听到的音乐了。

MP3内部结构

MP3播放器由液晶显示屏、微处理器、数码信号处理器(DSP)芯片、输入输出控制器、放大器和一些按钮组成。微处理器是播放器的“大脑”，用来接受用户选择的播放控制，并将当前播放的歌曲信息显示在液晶显示屏上，然后向数据信号处理芯片发出指令，使其准确地处理音频信号。数码信号处理器先用解压算法将MP3文件解压，接着用数模转换器将数码信息转换成波形信息，然后由放大器将信号放大并送到音频端口，最后我们就可以通过接在音频端口的耳机听到动听的音乐了。

选购注意事项

市场的快速更新使我们能够更快地享受到科技为人类带来的便捷，然而，同时也使选购变得困难起来，究竟什么才是我们想要的MP3呢？这里就涉及了一个定位问题，只要明确自己的购买目的，才能准确地选择到优秀的产品。

一、造型

出色的造型设计，不仅仅是要表现MP3的与众不同，也是凭借它来确定质量优劣的最重要标志之一。虽然生活中不能以貌取人，但对于MP3这类人为的商品，“以貌取物”准确度却是八九不离十。

型状必须是别出心裁，而不是满大街都可以看到的公模设计，由于开发MP3模具并不容易，而且有一定的外型设计专利，厂商必然把这部分产品定位为高端机型，亦会更花心思。色调的搭配很重要，通常高级的设计师才会非常注重这一方面，不一定要色彩鲜艳，但肯定要搭配合理，使MP3看起来更高贵典雅一些。对使用者形成了强烈的视觉冲击，特别是那些针对时尚爱美MM量身定做的产品，色彩比任何功能更具吸引力。此外，高级烤漆加工处理后，还会使外壳不易丢色，这可以从外壳的色泽反光度上看出。

材料选取上，金属最佳，橡胶次之，工程塑料最差，当然，这并非说金属造的MP3就是好货，而是金属相对来说会抗击力强些，而且看起来比较漂亮，更有质感和档次。所谓“行家一出手，便知有没有”，摸一摸MP3的外壳，看看它是否顺手，即可大致判断MP3的材料品质。做工主要是看产品的细微之处与各部分之间的连接位置，如果是外壳拼接紧急（特别是电池盖位置），按键柔软舒适，没有毛刺和机体不平整的问题，基本上算过关了。

轻巧的重量是不可忽视的一点，MP3是随身听设备，即使外观设计得再突出，不便于携带或体积过大的话，同样失去了“随身”的精髓。镜面是最近非常流行的设计，不过，真正的纳米镜面是可以清楚地反射出光线，当作镜子用。镜面的最大缺陷是一旦划伤之后，伤痕会变得非常明显，就像撕破脸的美女。丹丁的DX-8机身形状为流线型的类椭圆形，而且在上下两端的曲线弧度并不一样，看上去和鸡蛋的平面图确实很相像，所以被命名为“彩蛋”。

二、显示屏

科学在发展进步，时尚同样也在发展进步，我们用的手机早已从简单的单色屏幕进入了彩色屏幕的时代，同样，消费数码产品的典型代表MP3播放器也已经开始迈出了步入彩屏时代的步伐，而且相信这也必然会成为未来发展的主流。

以色彩效果来分，自然是颜色数目越高越好，屏幕材料则是LTPS（Low Temperature Polysilicon，低温多硅显示器）好于TFT，TFT（thin film transistor，薄膜晶体管）好于STN（Super Twisted Nematic，超扭曲向列），至于OLED（Organic light-emitting diode，有机电激发光显示器）彩屏，则是在黑暗中较有优势，但无法如TFT和STN般显示复杂的图片。

由于MP3体积小，屏幕尺寸会大受限制，而且屏幕并非越大越好，而是要看显示内容的多少，相同尺寸下，显示内容越多证明屏幕分辨越高，看图片时会越显得细腻，也利于加入人性化图形菜单，使操作方式贴近日常的Windows视窗习惯。

三、芯片

最主要的芯片是存储和解码芯片，厂商通常不会透露存储芯片的资料，当然是三星、英特尔、东芝等大厂的芯片质量较好，可惜只有拆机才能看出，不提也罢。

至于解码芯片，在许多MP3评测中都有提到，它不仅决定了音频处理的速度，也确定了MP3的特别音效功能，包括多重EQ、3D音效。当然，解码芯片也是影响音质的最重要部分之一，APU（Audio Processing Unit，音频处理单元）的算法会对波形的还原起着决定性的作用。虽说MP3格式也是有损压缩，但是使用高采样率之后，MP3的音质会大幅度提高。不过，高采样率的MP3音频文件需要解码芯片支持高数据流，而此时廉价产品所使用的解码芯片显然力不从心。

四、耳机

耳机包括两部分，一个是MP3本身的输出功率，输出功率大（两个耳机加起来20mW以上）可以推动一些阻抗比较高的高档耳机，令音质上的表现更加完美；二是耳机本身的质量，以貌取机是必然之路，优秀的耳机外观肯定不会差到那里去。最要注意的是那些耳机号称是某革著名大厂耳机的OEM，借以作宣传作用。实际上，大部分耳机并非真的是OEM产品，徒具一个形似的外表，内里跟本不是那么一回事。人怕出名猪怕壮，一旦某耳机型号树立起名牌效应，许多耳机厂商就跟风生产形似的产品，连带着MP3厂商也在插上一脚。因此，我们千万不能盲从于商家或某些新闻稿文章的描述，最佳的方法仍然是自己聆听。老实说，市面上大多数MP3的附带耳机都不怎么样，即使是中高级产品，仍然让我们感到失望，只有那些真正的高端产品，才会有较容易为人接受的耳机。如果你真的很注重MP3附送耳机的质量，只有从每个品牌最高端的几只型号中选取。

顺带一提，即使是真的OEM耳机，其产品性能、质量都必然逊于零售版的耳机。零售版产品要同时考虑到品牌形象和盈利，对产品的要求会高许多，相对来说，OEM只是随机附送的，部分标准未达到零售版的要求，也无须太过注重。总而言之，大家不要太过迷信MP3附送的OEM耳机，不如另花钱购买一些名牌耳机为好，价格约50-150元的第三方耳机，效果绝对好于所谓的OEM产品。

五、电池

MP3电池一般是采用的锂离子集合物电池.该电池具有体积小.容量高.重量轻等特点.

买的时候应该注意或者重点考虑电池的容量,当然是容量越高越好.

六、功能

MP3的功能越来越多，它与PDA、手机一样，都向多功能方面发展，尽可能吸收其它产品的功能，以便增加产品卖点。购买时要按需入手，别盲目性地追求多功能，功能越多价格越贵，而且买回来之后，你会发现有许多是跟本用不上的。

●可移动硬盘：电脑直接把MP3识别为一个移动存储器，可存放音乐以外的各种文件。

●固件升级：解决发布产品后的己知软件、硬件故障，增加新功能。

●文件夹浏览：按文件夹方式存储不同的歌曲，并且以此为单位播放，无须所有MP3都放于同一目录下面，提高管理易用性。

●多国语言：主要支持中文简体、中文繁体、韩文、日文、英文，某些机型甚至有26国语言。

●A-B复读：反复读某一段的内容，便于学习外语。

●文字阅读：通常只有屏幕大的MP3有此功能，可以当电子书看，某些产品还支持PDA的文本格式。如果固件容量足够，还可以下载各种不同的中外文字体。自动卷轴功能也很有用，自动向上或者向下翻页时背景灯长亮，既省去了自己翻页的麻烦，也完全弥补了小显示屏的缺点。甚至能边看书边听MP3，如同功能简化的PDA。

●TTS（text-to-speech，文本语音朗读），把文本直接用MP3发声转换为文字，机器声没有语气和节奏变换，听起来会觉得很奇怪，但很适合不想看书的懒人。

●字典：英汉字典，用作翻译之用，注意，MP3控制键有限，输入英文单词并不容易。

●自动录音功能：通过SAD（Sound Activity Detector，声音激活侦察器），可设定无声时间长短，只有当有声音时才会录音，不但节省内存空间，更在回放时节省时间。

●远程录音：使用AGC（Auto Gain Control，自动增益控制），可调节灵敏度和录音质量（低，重，高），适用远距离外部录音，如：会议。

●FM：收听电台，许多产品都能预设若干个频道，无须每次调节。

●FM录音：把电台内容转存为MP3，某些产品还有FM录音！可以输入星期几，几时几分开始对多少赫兹的频道进行录音，这对于喜欢的广播节目或者外语学习节目不会因为忙碌而错过，可录制下来慢慢听。

●EQ设置：即为音效的设置。几乎每款产品都会有几种已经预置的音效设置，如普通、摇滚、爵士、流行、古典。有的MP3还支持自定义音效设置，用户可以根据自己的喜好来定制。但无液晶屏显示的产品，这些EQ设置几乎就不存在了，仅有本身固化的一种音效模式。这样对于一些特别忠爱个性音乐效果的朋友就显得有些残忍了。

●直录：把外部音源（CD/MD随身听、家庭音响、电脑）编码压缩为音乐文件，直接存在MP3上。由于MP3机内置的编码芯片性能较差，音质比不上电脑压缩的音乐文件。

●时钟：时间设置可以输入月日，时分，又能作为手表用了。

●闹钟：可设置定时闹钟，不仅可以在耳塞出嘀嘀声，自带扩音器亦同时会嘀嘀，不带耳塞时闹钟也会生效。

●定时关机：可设定时间在0～180分之间定时关机，当然也可以设定0～60分之间的无操作自动关机，最方便晚上睡觉前听歌。

●图片浏览器：不仅可以浏览拍摄下来的照片，更可以欣赏电脑下载的图片。因为MP3的屏幕小，分辨率相对较高看图片会觉得份外精美，但大多数屏幕都有比例限制，比例不对则会出现变形而无法正常显示现象。

●数码相机：如同手机初期的摄像头那样，采用10 - 30万像素1/5.5" CMOS镜头，CMOS主要缺点就是亮度感应慢，所以在光线充足的环境下拍摄出来的效果才比较好。CMOS的最大优点就是体积小，最适合装在MP3随身听上。摄像头本身也有多种功能，能进行数码变焦，多种效果拍摄等。

七、电池

大部分MP3采用5号（AA）或7号（AAA）电池，它们可以随意买到，价格也较为便宜（0.5-5元）。如果是可充式锂电（10 - 15元），使用时间相当悠长，播放时间都可达到10小时以上，再携带多一颗电池，可以满足2-3天的需求，你总不可能一天到晚都用耳机塞着耳朵吧。

这里着重要讲讲的是锂电，分为可拆卸和不可拆卸两种，可拆卸锂电使用非常方便，可以随时更换，除了可以使用USB线连接电脑后充电，也可以使用附带的电源适配器为充电。其超大容量和特殊的放电方式，可以保证30小时以上的播放时间，足以顶得上三颗AA电池。不过，使用可拆卸锂电的MP3少之又少，市面上不会超过10款。电池上的铭牌会标明了电池工作电压，安全事项，保修期等信息，还有最大输出电流和充电时间，方便另购，可是购买一个可拆卸锂电的价格亦相当昂贵（150-200元左右），由于它的体积太小，不小心遗失会令人十分心痛。

相较之下，不可拆卸锂电没有遗失问题，使用这类电池的MP3通常体积相当小巧，甚至连省电大户的液晶屏也欠奉，不过，仍能保持6-8小时的播放时间。它的最大问题是经常要充电，长时间使用的话，必须随身携带充电器，真是相当麻烦。如果你有多种数码产品的话，光是充电器的重量已经够你受的了。此外，还要注意它的寿命，许多人使用锂电都是不太爱惜的，往往是电池未用完就充电，或者一天之内反复充多次，这会严重影响锂电的正常寿命。先兆是使用时间越来越短，直至最后无法充电。不可拆卸锂电一旦损坏，只能拿到厂商处维修换电池，只有厂商才有这类造型独特的专用电池，更换价格约为100元／颗。产品过了保修期之后，还要付维修费，长远投资会倍增。

八、容量

容量当然是越大越好啦，10-40GB的容量能够储存的歌曲，和256MB-1GB的存储量不可同日而语。然而，容量却涉及到许多的问题。谈及大容量的MP3播放器，很多熟悉这个市场的读者一定会想到创新的JUKEBOX，作为开创大容量MP3播放器市场的产品，这款产品一度成为了大容量MP3的代名词。和第一代的JUKEBOX相比，虽然最新的产品体积略有缩小，但是仍然属于“庞然大物”的级别。由于体积过大，这款产品也受到了很多消费者的诟病，也直接导致了其在与苹果推出的iPod对垒中的失败。iPod之所以能够成功，同时凭借了靓丽外观、较小体积和超大容量。至此，大家明白到，在追求容量的同时，也不能过于忽视体积和成本，只有在三者间取得很好的平衡，才能保持产品的生存价值。

值得注意的是，目前大部分MP3都采用Flash芯片作为存储介质，而Flash芯片昂贵的价格成了大容量普及遇到的一个最大障碍。因此，技术上的突破将是大容量播放器发展的方向，如果真的需要追求高容量，只好放弃Flash芯片，选择硬盘式MP3。看看那些512MB-1GB产品的天价，足可以购买到容量几十倍的硬盘MP3，是否需要为体积作出如此大的牺牲，真是要考虑清楚了。除非你是那些从来不拿背包、带包、挂包，连钱包、手机也不想带在身上，希望“无机周身轻”的人，又或者是银两多得用不完，正头痛如何花钱的朋友，不然的话，依然是硬盘式MP3具有最佳性能／价格比。

这里要特别一提DMC生产的Xclef 500，它是至今为止最大容量的MP3，存储量高达137GB，使用USB 2.0接口，使用线路输入或光学输入可实现可达320Kbps的录音质量。支持MP3 VBR压缩率。内置2.5寸的硬盘，具有FM收音、FM录音、语言录音，7行大屏幕显示，支持ID3，有多种语言版本支持，使用内置锂电池，容量为2000毫安，其机身具有12MB缓存，信躁比大于90dB，失真率仅为0.01%，耳机输出功率为双10毫瓦，其重量为255克。价格在450美元左右，呵呵，其价格足以买到高性能PDA了。

九、传输速度

现在的MP3，绝大部分有闪存盘功能，无论是在传输文件或音乐的时候，速度都是非常重要的。USB 2.0也称为Hi-Speed USB，它的传输速度达到480Mbps=60MB／秒，换言之，理论上一秒种可传输12首5MB大小的MP3。至于IEEE 1394（火线），速度是400M bps = 50MB／秒，一秒种可传输10首5MB大小的MP3。对于256、512MB的产品来说，复制歌曲只是举手之劳，就算是GB级的硬盘MP3，亦不会显得太慢。然而使用USB 1.0的话，它的速度只有12M bps = 1.5MB／秒，复制一首5MB的歌曲已经要3.3秒，真是等到花儿也谢了，特别是在硬盘MP3上，没有多少人有如此好的耐性。

购买之前，一定要看清楚MP3是否支持USB 2.0，现在市面上约有30-40种产品支持USB 2.0，一般是较新的机型。可是，并没有多少产品会把此特性明确地标记在外壳上，我们只能通过说明书或包装盒来查找，或者直接询问经销商，真的无法确定的话，最好的方法是插在电脑上试试，由于大部分主板已经包含USB 2.0接口，Win XP会提示找到相关设备。

十、附件

附件质量是看出厂商是否肯花心思的最直接方法，通常MP3都有产品说明书、耳塞、USB联机线、保修卡、驱动光盘，较高端的产品还会附送扣在身上的臂带、布袋、皮袋、音频转接线、音乐直录线、挂在脖子上的挂绳、耳塞保护膜、电池、充电器等。简而言之，附件的数量越多，造工超精致，证明随身听本身的质量也不会差到那里去，君未听闻“猛将手下无弱兵”之言吗？

十一、所支持的格式

MP3格式是最为常用的，它支持采样率为44.1KHz，可以使用的比特率一般是8-256Kbps。不同的MP3产品对采样率和比特率的支持范围也不尽相同，当然支持的范围越广越好，对于采样率，好一点的产品可以支持到48KHz。对于动态编码VBR，可以在同等音质下使文件的体积更小，有些机器是不能支持的。WMA是微软推广的一种格式，压缩率一般在5-192Kbps。在相同音质下，WMA可以比MP3格式文件的体积更小，所以拥有此功能的MP3播放器等于变相增大了其内存容量。还要提醒朋友们的是，用Windows自带的WMP压缩文件时，需要把版权保护的选项去掉，否则压出来的WMA文件在MP3上无法播放；从网上下载的WMA文件都经过了加密，因此用支持WMA的播放器有可能也会出现不能播放的情况。对于其它的格式，如ASF、WAV等，都没有MP3和WMA格式好用，从实用的角度来看，是可有可无的。

十二、频率响应范围

人的耳朵能听到的声音频率范围是20-20000Hz，低于20Hz和高于20KHz的声音都是人耳分辨不出来的。不过频响范围在50Hz到18KHz之间，应该就已经可以了，目前的MP3应该都可以到达这个频响范围了。不过频响范围与采样率是不同的，大家不要混淆了。

十三、信噪比

信噪比即音源产生最大不失真声音信号强度与同时发出的噪音强度之间的比率，通常以“SNR”或“S/N”表示，是衡量音箱、耳机等发音设备的一个重要参数。对于MP3来说，也是一个很关键的参数。“信噪比”一般用分贝（dB）为单位，信噪比越高表示音响器材的效果越好。一般而言，至少要选择信噪比在60dB以上的产品。但目前还没有一个正式的检测机构来评定产品的信噪比，所以一些劣质的MP3产品说明中也标有很高的信噪比，这只能靠您自己的耳朵来验证了。MP3在没有播放任何音源信号时，若能听到较为明显的“嗡嗡”或“嘶嘶”的类似电流的声音，说明机器的信噪比太低，不适合选购。

mp3玩家交流聚集地

欢迎大家去百度贴吧：MP3玩家吧，探讨MP3、MP3购买、使用技巧。

MP3玩家吧建吧时间：4月份，建吧不满一个月，就已在百度全国“网友俱乐部”分类中排名达到238名！且短短2个月总贴数突破1万帖！可见本吧人气不可挡！在mp3各相关贴吧中享有较高声誉。

本吧希望给大家提供一个舒适的MP3讨论环境，大家有任何MP3选购、MP3使用等MP3相关的问题和MP3使用经验，都可以在这里发表或提问，也希望大家和谐讨论，谢谢大家的支持！

本吧聚集了众多高手，如：齐天小宝，⑦仙道彰☆，iamthe1，蓝色流星雪，Know消夜，lusan63，血之韵律，DuDuLana，airorbit。

本吧高手将即时为您解答问题，基本5分钟内必有人回复。

MP3的原理

MP3是利用一种音频压缩技术，将声音用1∶10甚至1∶12的压缩率压缩。由于这种压缩方式的全称叫MPEG Audio Layer3，所以人们把它简称为MP3。用MP3形式存储的音乐就叫作MP3音乐，能播放MP3音乐的机器就叫作MP3播放器。

MP3的利弊

优点

MP3的优点有许多，主要有三点：一是由于大大压缩了文件的体积，所以相同的空间能存储更多的信息；二是由于没有机械元件，全部是电子元件，所以不存在防震问题，更加适合运动时欣赏音乐；三是可以随心所欲编辑自己喜爱的歌。

缺点

有一利便有一弊，MP3也有一些缺点。MP3音频压缩技术是一种失真压缩，因为人耳只能听到一定频段内的声音，而其他更高或更低频率的声音对人耳是没有用处的，所以MP3 技术就把这部分声音去掉了，从而使得文件体积大为缩小。虽然听上去MP3音乐仍旧具有接近CD的音质，但毕竟要比CD稍逊一些。

概述
MP3格式特点
mp3发展历程
MP3的音频质量
授权和专利问题
MP3播放器
MP3播放器解析
选购注意事项
mp3玩家交流聚集地
MP3的原理
MP3的利弊

词条信息

浏览次数：7185 次
编辑次数：3 次
贡献者：jxwnwh 中国通信一员