颗粒合成外文翻译资料

 2022-07-27 14:26:07

Chapter 15

Granular Synthesis

Abstract In this chapter, we will look at granular synthesis and granular effects processing. The basic types of granular synthesis are discussed, and the influence of parameter variations on the resulting sound is shown with examples. For granular effects processing on a live input stream, we write the input sound to a buffer used as a source waveform for synthesising grains, enabling granular delays and granular reverb designs. We proceed to look at manipulations of single grains by means of grain masking, and look at aspects of gradual synchronisation between grain-scheduling clocks. The relationship between regular amplitude modulation and granular synthesis is studied, and we use pitch synchronous granular synthesis to manipulate formants of a recorded sound. Several classic types of granular synthesis are known from the literature, originally requiring separate granular synthesis engines for each type. We show how to implement all granular synthesis types with a single generator (the partikke 1 opcode), and a parametric automation to do morphing between them.

15.1 Introduction

Granular synthesis (or particle synthesis as it is also called) is a very flexible form of audio synthesis and processing, allowing for a wide range of sounds. The technique works by generating small snippets (grains) of sound, typically less than 300sim;400 milliseconds each. The grains may have an envelope to fade each snippet in and out smoothly, and the assembly of a large number of such grains makes up the resulting sound. An interesting aspect of the technique is that it lends itself well to gradual change between a vast range of potential sounds. The selection and modification of the sound fragments can yield highly distinctive types of sounds, and the large number of synthesis parameters allows very flexible control over the sonic output. The underlying process of assembling small chunks of sound stays basically the same, but the shape, size, periodicity and audio content of grains may be changed dynamically. Even if the potential sounds can be transformed and gradually morphed from one type to another, it can be useful to describe some of the clearly defined types of sound we can attain. These types represent specific combinations of parameter settings, and as such represent some clearly defined locations in the multidimensional sonic transformation space. Curtis Roads made a thorough classification of different granular techniques in his seminal book Microsound . Roadsrsquo; book inspired the design of the Csound opcode partikkel, as a unified generator for all forms of time-based granular sound . We will come back to Roadsrsquo; classification later, but will start with a more general division of the timbral potential of granular techniques. The one aspect of the techniques that has perhaps the largest impact on the resulting sound is the density and regularity of the grains. Because of this, we will do a coarse classification of the types of sounds based on this criteria. This coarse division is based on the perceptual threshold between rhythm and tone: below approximately 20 Hz, we tend to hear separate events and rhythm; when the

repetition rate is higher the events blend together and create a continuous tone. The boundary is not sharp, and there are ways of controlling the sound production so as to avoid static pitches even with higher grain rates. Still it serves us as a general indication of the point where the sound changes function.

15.1.1 Low Grain Rates, Long Grains

When we have relatively few grains per second (lt; 50) and each grain is relatively long (gt; 50 milliseconds), then we can clearly hear the timbre and pitch of the sound in each grain. In this case the output sound is largely determined by the waveform inside each grain. This amounts to quickly cross-fading between segments of recorded sound, and even though the resulting texture may be new (according to the selection and combination of sounds), the original sounds used as source material for the grains are clearly audible.

15.1.2 High Grain Rates, Periodic Grain Clock

When the grain rate is high (gt; 30sim;50 Hz) and strictly periodic, we will in most cases hear a pitch with fundamental frequency equal to the grain rate. Any sound that is periodic (the exact same thing happening over and over again at regular intervals) will constitute a clearly defined pitch, and the pitch is defined by the rate of repetition. If the contents of our individual grains are identical, the output waveform will have a repeating pattern over time (as illustrated in Fig 15.1), and so also constitute a clearly perceptible pitch. It is noteworthy that very precise exact repetition is a special case that sounds very different from cases where repetitions are not exact. The constitution of pitch is quite fragile, and deviations from the periodicity will create an unclear or noisy pitch (which of course might be exactly what we want sometimes). In the case of high grain rate with short grains, the audio content of each grain is not perceivable in and as itself. Then the waveform content of the grain will affect the timbre (harmonic structure), but not the perceived pitch since pitch will be determined by the rate of repetition (i.e. the grain rate). More details on this are given in Section 15.5.

Fig. 15.1 Close-up of a grain waveform, repeating grains constitute a stable pitch

15.1.3 Grain Clouds, Irregular Grain Clock

When the grain generation is very irregular, usually also combined with fluctuations in the other parameters (e.g. pitch, phase, duration) the resulting sound will have turbulent characteristics and is often described as a cloud of sound. This is a huge class of granular sound with a large scope for variation. Still, the irregular modulation creates a perceptually grouped collection of sounds.

15.2 Granular Synthesis Versus Granular Effe

全文共24172字,剩余内容已隐藏,支付完成后下载完整资料


第15章 颗粒合成

在本章中,我们将讨论颗粒合成和颗粒化的方式。颗粒合成的基本类型已经讨论过了,参数变化对声音造成的影响将会举例展示。因为粒子化是对动态的输入流进行处理,我们将输入声音作为合成颗粒的源波形写入缓冲区,以便设计颗粒延迟和颗粒混响。我们继续来看运用颗粒掩盖法对单个颗粒的操作,以及在逐步同步的角度看粒子间的时序排列。我们已经研究了常规振幅调制与颗粒合成之间的关系,接下来用基因同步粒子合成来处理一个记录声音的共振峰。从文献中我们已经知道了一些典型的颗粒合成类型,最初需要单独对每种类型进行颗粒合成。我们介绍了怎样用一个单一的发生器进行所有种类的颗粒合成(见代码partikke 1),以及在其中一个自动变化的参数。

15.1简介

颗粒合成(也称为粒子合成),是一种非常灵活的音频合成和处理形式,可以处理的声音范围非常广。这个技术通过产生小的声音片段(粒子),通常小于300~400每毫秒。这些粒子会有一个包络使每个片段平滑地淡入淡出,大量这种粒子的集合构成了声音。这个技术的有趣之处在于,它很适应于巨大范围内潜在声音的逐渐变化。声音片段的选择和变化可以产生非常独特的声音,并且大量的合成参数可以灵活控制声音输出。合成小音块的基本过程是基本相同的,但粒子的形状、大小、周期性和音频内容可以是动态变化的。即使潜在的声音可以转化或者从一种类型变化为另一种,它可以描述一些我们能获得的一些已有明确定义的种类的声音。这些种类代表了参数设定的特定组合,和一些多为声波变换空间中已有明确定义的位置。Curtis Roads在他的具有开创性的著作《Microsound》中对颗粒技术做了一次全面的分类。Roads的书启发了Csound opcode partikkel的设计,作为一个统一的作用于所有构成类型的基于时间(产生)的颗粒状声音的合成器。稍后我们将回溯Roads的分类,但我们首先会介绍一个对颗粒技术的潜在音色更加一般的划分方式。这项技术的一方面(效果)是可能够影响到得到的声音的密度和规律。因此,我们会基于这个标准对这些类型的声音做一个粗略的分类。这个粗略的划分是基于节奏和音调中的一个可感知的阈值:大约在20赫兹以下,我们更可能听到不同的类型和节奏;当重复率较高时,事件融合在一起形成一个连续的音调。边界不是分明的,并且有控制声音产生的方法以免更高的粒子率下出现声音不变的情况。它为我们提供了一个可以修改声音函数的一般标记点。

15.1.1低颗粒率,长颗粒

当每秒有相对少的颗粒(lt;50),并且每个颗粒相对长(gt;50毫秒)时,我们可以清楚地听到每个颗粒的音色和音高。在这种情况下,输出的声音很大程度上取决于每个颗粒内部的波形。这相当于记录声音的(声)段中的交叉衰减,即使得到的声纹可能是新的(取决于声音的选择和组合),用作颗粒的原材料的原始声音是清晰可听的。

15.1.2高颗粒率,颗粒具有周期性

当颗粒率高(gt;30~50Hz)并且具有严格的周期性时,大多数情况下我们会听到一个音,其音高具有与颗粒率相同的基因频率。任何具有周期性的声音(完全相同的声音定期反复)将会构成一个明确的音高,这个音高是由重复率决定的。如果个别颗粒的内容是相同的,输出波形会呈现一个重复的图案随着时间推移(如图15.1所示),所以也可以构成一个清晰可感的音高。值得注意的是,如果出现精确的重复精度是特殊情况,此时与不完全精确的情况听起来截然不同。音高的构成是非常敏感脆弱的,周期性的偏离会导致音调出现杂音或不清晰(当然这也许有时正是我们想要的)。在高颗粒率,短颗粒长度的情况下,每个颗粒包含的音频内容是不可感知的。然后粒子包含的波形内容会影响音色(谐波结构),但不是可感知的音高,这是因为音高由重复率决定(即颗粒率)。更多细节详见15.5节。

图15.1 一个颗粒波形的特写,重复的颗粒构成一个稳定的音调

15.1.3颗粒云,颗粒时钟具有随机性

当颗粒的产生不均匀时,通常也连同了其他参数的的波动。(如间距,相位,持续时间)所产生的声音具有紊乱性,通常被描述为一个声音的云。这是一大类在大范围内变化的声音颗粒。但是,这个不规则的调制会创造出一个可感知的声音采集分组。

15.2颗粒合成与颗粒效果处理

通过颗粒合成,通常指的是应用于合成或预录的音源的颗粒技术。如果我们使用一个动态的音频流作为颗粒的来源,我们使用颗粒效果处理。从技术上讲,两种情况下的音频颗粒创建是相同的,只有颗粒的源素材不同。将颗粒技术应用到实时音频流中,在保证实时音频效果的即时性和交互性的前提下丰富了颗粒合成的转换潜力。我们使用tablewa操作码将实时音频录制到列表中作为源波形,如列表15.7所示。这是一个循环缓冲区,为了控制由记录(写)和回放(读)的位置差异引起的延时,我们把记录指针写入全局变量速度k(gkstartFollow)。我们会在计算用于创建颗粒的读取位置时,引用这个变量。还要注意,全局变量必须设置为1,否则在使用颗粒处理的反馈时系统会溢出。

15.2.1颗粒延迟

对于所有的颗粒处理效果,实时的音频流会被记录到循环缓冲器(列表15.7)中,从中读取单个颗粒。该缓冲区内的记录和播放位置之间的差异将影响录制和播放声音之间的时间,这样我们就可以控制延迟的时间。使用samplepos参数设置读取位置。这是一个范围为0.0到1.0的值,参考源音频波形内的相对位置。样本值为0.5,因此意味着从源声音的中间开始读取颗粒。延迟时间(以秒为单位)可以计算为samplepostimes;缓冲区长度(以秒为单位)。我们必须确保在记录指针之前不要读取(如果我们使用循环缓冲区的零延迟时间的随机偏差就很容易产生问题)。或者,我们也可以创建点击的次数,并播放相对于我们的预期稍有延迟(缓冲区长度)的音频。如果我们使用零延迟并且向上调置波形,将会发生穿越边界记录指针的情况。在这种情况下,我们开始读取的同一位置记录音频,但我们读取的速度比记录快,并且读取指针将赶上记录指针。为了避免这种情况,我们需要添加一个最小的延迟时间作为我们想要创造的颗粒波形中音高times;持续时间的一个因素。当操纵和调制时间指针进入循环缓冲区,我们可能得使波形缓和并在处理前的最后阶段按a的比率向上采样。这里需要特别注意,因为我们不想在1.0到0.0的重置区间内对斜波信号进行滤波。为此,我们可以使用UDO(列表15.8),在信号的所有部分进行上采样期间进行线性插值,除非它突然从高变为低电平。如果我们进行了常规插值,则在重置阶段,时间指针将快速扫描整个缓冲区,并且计划在扫描期间启动的任何颗粒将包含意外的源音频(参见图15.2)。

图15.2以k速率时间指针(samplepos)上采样

我们需要在重置阶段禁用插值,以避免在相位折回时快速向后读表。

对于粒子化处理,颗粒率通常较低,因为我们乐于听取直播音频流中的音色内容。颗粒延迟的一个有趣的方面是延迟时间的变化不会导致音高调制,这与传统的延迟技术相同。这允许我们对延迟时间和音高进行单独的控制,并且还将具有不同时间和音高关系的颗粒散布到连续的回音液滴中。 将颗粒延迟处理的输出写入循环缓冲区(与实时输入混合)允许颗粒延迟反馈,其中相同的转换过程在相同的源音频上重复和迭代地应用,这会产生级联效果。

15.2.2颗粒混响

我们可以使用颗粒技术来产生人为的混响效应。这些并不一定针对模拟真实的声学空间,而是为探索新颖和虚构的混响环境提供了非常灵活的工具。由于传统的人造混响技术基于延迟技术,基于颗粒延迟的颗粒混响也是如此。除了复杂的延迟模式之外,我们还可以利用颗粒合成中时间和音高的独立性来创建直播流的时间延长形式。时间延长是在声学空间中极不可能发生的事情,但是由于混响也可以作为声音的一定延长而被听到,所以我们可以将这种类型的变换与一种混响结合起来。当现场信号时间延长时,我们很快就遇到了一个实际的问题。 时间拉伸包括逐渐增加输入和输出之间的延迟时间,如果声音被认为是“立即放慢”,那么在我们听到减速版本声音之前我们想要的实际延迟有一个限制。为了缓和这种延长时间的增加,我们使用几个重叠的时间延长过程,当延迟对于我们的目的而言变得太大时,上述过程会逐渐减弱,并且同时逐渐显现一个新过程(将新的过程的延迟重新设置为零)。 见图15.3和列表15.11。

图15.3时间指针和源波形放大器,用于时间延长实时输入。四个延长段中的每一个构成针对partikkel的源波形颗粒过程。利用颗粒合成中的时间和音高转换的独立性,我们还可以通过闪烁的和声尾部产生混响效果,或者我们可以创建具有不断滑动音高的尾巴。在每个音高移位组件中,该设计通常需要至少一个颗粒过程。 在我们的例子中,我们仍然使用一个(四声)颗粒发生器,以非常低的计算成本创建一个简单和原始的效果版本。我们在逐颗粒的基础上进行音高移位(带音高掩蔽,每次第三个颗粒被转置,参见第15.3节),而不是为每个音调使用单独的颗粒声音。作为通过这种简单设计获得相当密集的混响的解决方法,我们使用的恰好是长颗粒。为了更好地控制不同的频光谱分量,并且产生更加密集的混响,我们可以使用多个颗粒发生器,相互反馈。

15.3操纵个体颗粒

在规则的颗粒合成情况下,我们可能每秒产生几十或几百个颗粒。 为了精确控制合成结果,我们可能需要分别修改这些颗粒。为了做到这一点,我们可以使用一种称为颗粒掩盖的技术。 在Microsound中,该术语用于描述单个颗粒的选择性掩盖,这意味着可以逐渐的控制幅度。通过扩展颗粒掩盖的概念,还包括俯仰轨迹,频率调制,输出通道和源波形混合,我们还可以扩展各个颗粒的控制范围。在高颗粒速率下,任何掩盖将影响感知的间距。这是因为即使掩盖单颗颗粒也会影响信号的周期性(参见列表15.15)。间断地掩盖单颗颗粒会增加音色的噪音; 掩盖每秒产生的颗粒将使感知的音调下降一个八度,因为重复周期加倍(列表15.17)。 进一步的次谐波可以通过每三分之一,四分之一或五分之一等的颗粒来产生。无论哪个颗粒参数被掩盖,都会发生这些音高效应,但是由于不同参数的掩盖,音色效果会有所不同(列表15.19)。在较低的颗粒率下,掩盖技术可用于创建精巧的韵律,空间和谐波模式。如果我们使用不同的掩盖长度,我们可以实现不同参数的掩盖模式之间的复合关系。这对于增加音高发展的生动性和复杂性来说是非常有效的。 在Csound的partikkel操作码中,颗粒掩盖由掩盖表指定(图15.4和15.5)。当生成颗粒时,增量读取掩盖表,因此表中彼此相邻的值将连续应用于相邻的颗粒。由于大多数颗粒掩盖模式是周期性的,掩盖表索引可以以用户指定的索引循环。 对于非周期性模式,我们可以简单地使用任意大的掩盖表或连续重写表值。

图15.4振幅掩盖表,两个第一个索引控制循环开始和结束,剩下的指数是每个连续颗粒的振幅值。表值可以实时修改来创建动态变化的模式。

图15.5使用图15.4所示的掩盖表来掩盖振幅

列表15.15每个记录中具有高颗粒率和随机屏蔽量增加量的同步颗粒合成

15.3.1频道掩盖,输出和空间化

使用具有幅度,音高和调制等参数的掩盖技术是明确的:我们可以总能准确描述它们对所产生的声音的影响。但若进行频道掩盖,情况会有所不同。频道掩盖描述了颗粒应该发送到的那个输出频道(颗粒发生器)。Csound的partikkel操作码可以使用多达八个音频输出,并且掩盖值也可以是分数,在两个输出之间分配声音。现在,我们用每个输出的声音做什么是任意的。我们可以将音频信号分配到收听空间中的不同位置,或者我们可能会以不同的方式处理每个输出。举个例子,我们可以把每五颗颗粒发送到混响,同时我们平移颗粒使每个颗粒左右都存在其他颗粒,并创建一个过滤器组,并选择性地将颗粒发送到每个过滤器(列表15.20)。 我们还可以简单地将八个输出路由到八个不同的扬声器,以在房间中创建一个颗粒空间图像。如果我们需要八个以上的独立输出,多个partikkel的实体可以相连接并通过partikkelsync操作码得到同步。有关详细信息,请参见第15.4节。

列表15.20通道掩盖示例,每隔一秒颗粒路由到立体声的左、右,每五分之一颗粒混响,并将随机颗粒路由到高通滤波器和低通滤波器。

15.3.2波形混合

我们还可以使用颗粒掩盖来选择性地改变每个颗粒的几种声源的混合。使用partikkel操作码,我们可以使用五个音源:四个采样波形和一个合成列车(参见第15.7.3节有关列车的更多信息)。波形混合掩盖表中的每个掩码将具有五个值,表示每个音源的振幅。除了通常类型的掩盖效应之外,波形混合技术对于视窗化重叠型技术是有用的,例如我们在颗粒混响时间延长中看到的。在这种情况下,我们将波形混合与每个源波形的单独时间指针结合在一起,因此我们可以将时间延迟的不同层(在源波形音频缓冲器中)淡入淡出。

15.4时钟同步

大多数颗粒合成器使用内部时钟来触发新的颗粒生成。为了及时控制颗粒的确切位置,我们有时可能需要操纵这个时钟。颗粒位移可以简单地用partikkel的k分布参数完成,在1/颗粒率 之间的时间内抵消各个颗粒。

列表15.24使用partikkel的k分布参数,单个粒子在 1/颗粒速率 的时窗内随时移位。颗粒的随机分布可以用idisttab表来设置。 以下是可以使用例如列表15.4中的示例的代码摘录。 另见图15.6。

...

kdistribution line 0, p3-1, 1

idisttab ftgen 0, 0, 32768, 7, 0, 32768, 1

...

a1 partikkel kGrainRate, kdistribution, idisttab, ...

为了更精细的颗粒时钟模式和同步,我们可以直接操纵内部时钟。partikkel操作码使用同步输入和同步输出来促进这种时钟操作,并且如果需要,这些也可以用于同步几个partikkel生成器。内部时钟由

全文共7552字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144313],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。