人们常说,绘画是空间的艺术,音乐是时间的艺术。绘画是颜色在空间中渲染,音乐是音符沿着时间流淌。而频谱是把声音中的频率沿着频率展开排列,并绘制成图像,就像阳光穿过三棱镜色散成七色光谱。各种各样的乐器、歌声都会产生出独特的频谱图,普通话中一二三四声的声调甚至会在频谱图画出抑扬顿挫的图案。
撰文 | 吴进远(美国费米国家加速器实验室)
上周晚自习之后,我和我暗恋的女神珍旭班长,一起看了她爷爷在她小时候给她讲的睡前故事傅立叶变换的视频(参见《给孩子讲傅立叶变换,肖邦的钢琴会怎么说?| 乐聊乐有理》)。不过,视频中还留下了许多且听下回分解的地方。又一天晚自习之后,我问珍旭班长:“你爷爷后来有没有给你讲频谱呀?”
“当然讲了。给小朋友讲睡前故事,每次不可能讲太多内容,因此复杂的话题就必须分成好几次来讲。”珍旭班长说着又找出一个视频,打开和我一起看。
1、各种乐器的频谱
“我是熊猫,我吃竹子,我要唱《五指歌》。”
“一二三四五,上山打老虎。(老虎!老虎!老虎!老虎!)……”
“今天,我们讲频谱。”爷爷说:“汉语中,谱是个很常用的字,它的意思是根据事物的类别或系统排列编制的表册、书籍或绘制的图形等等。比如家谱族谱,是按照辈分排列,记录家庭成员的文本。”
“我们弹钢琴或者唱歌用的乐谱是按什么排列的呢?”小珍旭问。
“乐谱是按照时间次序,把每个节拍中演奏演唱的音符记录下来的一种文稿。”
小珍旭举起熊猫晶晶:“爷爷,晶晶不懂。请爷爷,用熊猫和竹子作为例子,给晶晶再讲一讲。”
“在大熊猫繁育中心,有熊猫的食谱。食谱是按照时间顺序,把大熊猫每餐吃多少竹子,添多少窝头苹果胡萝卜开列记录出来的表格。”
“那频谱是什么?”
“频谱是把一个声音中存在的频率成分按照频率排列的图。我们常说的光谱其实是一种电磁波的频谱。光谱是按照颜色,也就是说光的波长或频率,记录下来的光强度分布。”爷爷说着,打开电脑,启动一个软件。然后拿起一把小提琴,对着电脑话筒,拉出一个稳定的长音,电脑上显示出一个频谱。(现在手机上也有可以生成频谱的应用软件。)
小提琴的频谱
“这个音是E,就是C调里的咪,它是用小提琴最细那根弦空弦演奏的,频率大约659赫兹。”爷爷解释道:“你看,频谱上显示出许多尖峰,最左边那个是基频,然后是2、3、4、5倍频等等。正是这些倍频泛音,决定了小提琴的音色。”
“我想看看我的小口琴的频谱。”小珍旭说着,拿起口琴,对着电脑话筒吹出一个长音,也是C调里的咪。电脑上显示出另一个频谱。
口琴的频谱
“成功啦,成功啦。”小珍旭高兴地说:“口琴的声音里也有基频和高倍频泛音。”
“你看看口琴和小提琴的频谱是不是不一样?”
“是不一样。”小珍旭仔细观察:“实际上,两种乐器前面三个尖峰的比例好像差不多,但是口琴第4、5、6等几个峰明显比较高。嗯,好像口琴的声音确实听着更亮一点。”
“老师有没有教过你们用口琴来模拟小提琴?”
“教过。”小珍旭边说边演示:“第一,舌头堵住下排孔,只让口琴上面的的簧片振动。第二,手捂住口琴前边,把口琴声音闷一点。这样,口琴听起来就很像小提琴了。”
“从频谱上看,用手捂住口琴,就可以让它的高频成分衰减得厉害点。我们把口琴第4、5、6等几个峰压低一些,它的频谱就和小提琴非常像了。这实际是用滤波的方法,来改变不同频率成分的相对强度,以获得不同的音色。”
2、挖一挖波形上的山峰
珍旭班长又找出一个视频打开。
“我是熊猫,我吃竹子,我要唱《五指歌》。”
“一二三四五,上山打老虎。(老虎!老虎!老虎!老虎!)……”
“我们昨天见到的乐器频谱里都有那么多峰,有没有只有一个峰的乐器?”小珍旭问到。
爷爷转身拿起一个小方盒,按了一个开关,方盒发出呜呜的叫声。
“这个小方盒是信号发生器,它可以发出正弦波信号,正弦波在频谱上只有一个峰。”
正弦波的频谱
“正弦波的波形看起来像是平静池塘水面上微小的波浪,很均匀,也很平滑。它的声音听起来很纯净,好像一点杂质都没有一样。”
“所以音乐家管正弦波叫做纯音。当然,如果用纯音来演奏音乐,就显得太单调了。此外,自然的发声体很少能发出绝对的纯音,因此,我们现在见到的乐器在频谱上都有很多峰。”
“要是把正弦波的波形改变一下,它的频谱会是怎样呢?”
爷爷搬动小方盒上的一个开关:“我们把正弦波的山峰堆高一点,低谷挖成尖尖的槽,让它变成三角波,这时我们就看到频谱上增加了一些尖峰。”
三角波的频谱
“三角波和正弦波差得不太多,所以新增加的这些峰比基频那个峰矮不少,而且一个比一个矮。”
“咦,好奇怪。”小珍旭指着三角波的频谱说:“频谱上第二个峰频率好像不是第一个峰的二倍。”
“你算算是多少倍?”
“好像是3倍。后面一个峰的频率是基频的5倍。再后一个是7倍。为什么新增加的这些高次倍频里没有2、4、6倍频呢?”
“是因为三角波是左右对称的。当你站在任意一个山峰或者山谷,向左看和向右看,看到的波形是相同的。”
爷爷又搬动小方盒上的开关:“我们要是把三角波的山尖铲平,把山谷填平,就得到梯形波。要是再进一步把山坡修得很陡,就得到方波。这种方波和正弦波差得更远,因此频谱里的高频成分就相对来说还是比较高了。”
方波的频谱
“方波也是左右对称的,所以也只有奇数倍频。”
“方波的声音听着像是单簧管。”小珍旭评论道。接着又问:“这些峰之间长出的小草是什么?”
“是因为方波波形在跳上和跳下的时候,速度非常快。系统里的电子器件跟不上,就可能产生一些失真。这些失真会在频谱上产生一些强度不太大的频率成分,就是这些小草。”
爷爷再次搬动小方盒上的开关:“现在,我们保持方波的一边不变,把另一边修理成缓慢下降的山坡。这时,我们得到一个锯齿波。”
锯齿波的频谱
“锯齿波不是左右对称的了,因此,频谱里出现了2、4、6、8等等的偶数倍频的尖峰。”
3、谱 图
珍旭班长又找出一个视频打开。把“一二三四五,上山打老虎”这部分跳了过去。
“我们这几天见到的频谱都单独一个呜呜声音的,真正演奏的音乐也可以做频谱分析吗?”小珍旭问道。
“当然可以。你可以到钢琴上来弹一个曲子,我们来分析一下这个曲子的频谱。”
小珍旭穿着睡衣睡裤从被窝里跳出来,自觉地加了一件衣服,跑到客厅,坐到钢琴边。爷爷让她弹了《一闪一闪亮晶晶》的前两句,只弹了右手部分。电脑上得到一个显示。
“对于自然的声音,包括用乐器演奏的音乐,我们大家可以把话筒采集到的声音切成一小段一小段来做频谱分析。每一小段时间之间,频谱都可能发生明显的变化。为了显示这种变化,我们应该把分析的结果按照时间展开,这样二维的频谱就变成了三维的。在上面的图中,纵坐标是频率,横坐标是时间。第三个维度,也就是频率成分的强度,用不同的颜色来表示,颜色越偏红,强度越大。这种显示我们一般叫做谱图,有的时候有人叫它声纹图。”
“哈哈,我看出来了。”小珍旭指着谱图:“这里面每一条竖线对应按下钢琴琴键演奏的一个音符。多多嗦嗦啦啦嗦——发发咪咪来来多——”
“你注意看。”爷爷说:“钢琴演奏的每一个音符,除了最低的基频,从下往上,还能够正常的看到很多整数倍频的泛音。”
“可是,”小珍旭问:“除了演奏音乐,或者唱歌,我们一般说话也可以做频谱分析吗?”
“可以呀。”爷爷说:“我们汉语普通话有阴阳上去四个声调,你可以挑几个有这四声的字来试一试。”
“一句话里包含有四个声调的字?这个好办。都——来——跑——步——身——强——体——壮——”小珍旭念道。电脑记录分析了这个段声音,显示出一个谱图。
“真好玩。”小珍旭说:“普通话里的一二三四声的声调,真的就像汉语拼音里标的那样,是水平、上升、拐弯和下降。”
“你现在能看出,这个图上一道一道的条纹了吧?”爷爷说:“所以有的行业的人管这类谱图叫做声纹。”
“这些条纹是什么?”
“我们讲汉语时的韵母,或者欧洲语言中的元音是一种周期性的振动,就像乐器演奏一个音符一样。因此韵母的频谱,也像乐器一样,是由基频和整数倍频构成的,在谱图上,是一组从下到上等距离的条纹。”
“这些条纹为何会上下拐弯呢?”
“我们说话的时候,声带的张紧程度不断变化,振动的频率也随着变化,在谱图上显现出来,就是条纹的上下拐弯。另外人的口型也在变化,口型变化影响到口腔的共鸣特性,这种共鸣使得不同的频率成分的相对强度变化。所有这些,使得我们说话的声音变得可以听懂。此外,不同的人声音也因为声带与口腔形状的不同而不同,使得我们从声音能够分辨出不同的人。有的情况下,即使说话的人刻意变声,专家也可能通过说话的谱图,来辨认说话人的声音特征。”
“每个人说话的声音都有它的特征,是不是就像人的指纹一样?” 小珍旭问。
“对的。所以,谱图被称为声纹图,也有这么一层意思。”
叮铃铃,电话响了,爷爷按下免提。奶奶那天晚上去单位开会,不放心,特意打来电话,嘱咐了很多。爷爷说,“放心吧,小珍旭学习睡觉,样样不耽误。”
电脑把电话内外的声音分析成频谱,显示出了谱图。
“吼吼吼。”小珍旭举着熊猫晶晶说:“你们人类喜欢打电话,可是又经常说电话里说不清。”
“哈哈蛤。”爷爷问:“你觉得什么说不清呢?”
“电话里的声音经常是闷闷的,好像感冒了一样。尤其是波坡、得特这样的声音不容易听清楚。”
“观察得很仔细。”爷爷表扬道:“从上面这个谱图,你就能大概看出原因。”
“前面这一段是电话里的声音,好像用剪刀整整齐齐地剪了一下。后面电话外说话的声音,就没有这么一种限制。”
“是的,我们现在用电话系统,把语音信息做了滤波,只有 3600 Hz 之下的频率成分可以通过,3600 Hz 以上的频率成分统统阻挡出去,这样做是为了节约通讯信道资源。本来人类的语言信号中,3600 Hz 以上的频率成分很少,所以切掉了影响不太大。但这些切掉的高频成分虽然量不大,但有时却携带较为重要的信息,可能影响通话双方的互相理解。”
4、为什么正弦函数那么牛?
“又在学习儿童睡前故事版呐?”泉余室友又一次毫无征兆地出现了。
“你又有青年失眠烧脑版的问题了?”珍旭班长问。
“还真有一个。”泉余室友说。
“那你要请我们俩吃夜宵。”我说。
“你俩?”泉余室友掩口而笑:“没问题。”
在校门外茶餐厅一通风卷残云之后,泉余室友抛出了他的问题:“为什么正弦函数这么牛呢?”
“在回答你的问题前,你必须把牛的定义讲清楚。”我说。
“我们做傅立叶变换、频谱分析的时候,实质上是把任意的信号看成是许多正弦函数的叠加。数学上,曲里拐弯的函数有很多,我们为什么就选中了正弦函数呢?”
“也许,在自然界中,很多物体是按照正弦函数的规律振动的。”我说。
“难道不是因为正弦函数简单美观,因此受到人们的青睐?”泉余室友反问。
“我觉得不是。”珍旭班长说:“数学中,简单美观的函数相当多,人们之所以选择正弦函数,而不是其他曲里拐弯的函数,恐怕还是受到了自然现象的启迪。”
“可是,我们印象中,人们想得到正弦波,都是用信号发生器来产生。”泉余室友仍有些怀疑:“你们说说,在我们周边50米范围内,哪些东西会产生正弦波?哦,手机不算哈。”
珍旭班长把高脚杯里的橙汁喝掉一半,放到桌上,指指高脚杯:“它就能产生正弦波。”
“真的?”
“做个实验怎么样?”珍旭班长说着,拿起一根筷子,“叮——”,轻轻地敲了一下高脚杯。
泉余室友掏出手机,点开频谱分析软件。珍旭班长又敲击了几下高脚杯,手机上的软件显示出一个谱图。
“你们看,高脚杯敲响时,存在许多振动模式,不同的振动模式有不同的频率。”珍旭班长解释:“可是频率比较高的那些振动模式衰减得非常快,最后就剩下一个频率最低的振动模式。因此,只有经过足够长的时间,高频模式衰减光了,杯子的振动就逐渐变成了符合正弦函数规律的简谐振动。”
我说:“在真实的世界上,也许没什么东西是严格按照正弦函数规律振动的。可是,当振动的振幅很小的时候,它们就趋向于简谐振动。比如单摆、吊灯、秋千等等,振动幅度比较大的时候,它们的振动规律非常复杂。但是在摆动幅度很小的时候,它们的振动规律就非常接近正弦函数了。”
“实际上,我们还可以看看科学史。”珍旭班长说:“牛顿在拿起棱镜分解太阳光的时候,他并没有先验地选择任何函数。可是,太阳光经过棱镜,由于色散,分解成了红橙黄绿青蓝紫的光谱。这种光谱,是把白光按照光的频率分解开来。这实质上说明,白光是以正弦函数为单位,与物质发生作用,从而产生色散的。”
“看起来,以自然现象为师,并不是一句空话。”泉余室友说。
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』开通了按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。
《返朴》,科学家领航的好科普。国际著名物理学家文小刚与生物学家颜宁共同出任总编辑,与数十位不同领域一流学者组成的编委会一起,与你共同求索。