Conditioning Methods for Neural Audio Effects

University of Oslo
DAFx 2024

Abstract

Machine learning techniques have become a common approach for modeling analog audio effects. Black-box and hybrid solutions have been applied to a large variety of audio effects. Audio effects usually incorporate user-controllable parameters, and how to infuse this information into the networks is still a challenge. Feature-wise Linear Modulation is a popular conditioning method, but its use in audio effect modeling is still limited. This technique involves an affine transformation via learnable coefficients based on conditioning information. This study compares this approach with other proposals used in this field, such as gated activation. In addition, the control parameters may present a nonlinear relationship with the effect’s associated sonic response. Therefore, the investigation also considers nonlinear mapping. This case study investigates two types of analog audio effects: distortion and dynamic range compression. Results indicate the conditioning layer leads to better performance if placed at the end of the architecture, and the Feature-wise Linear Modulation method outperforms other approaches. In addition, nonlinear mapping can be beneficial for cases with strong nonlinear relationships between parameters, such as the overdrive effect.

Audio Examples - Compressor [Post]



Input	Target

Setting	Method	Prediction
Threshold: -3 dB Ratio: 1.5:1	Extra input
	Gated Activation
	Feature-wise Linear Modulation+Gated Linear Unit
	Feature-wise Linear Modulation+Gated Convolutional Unit
Input	Target

Setting	Method	Prediction
Threshold: -20 dB Ratio: 4:1	Extra input
	Gated Activation
	Feature-wise Linear Modulation+Gated Linear Unit
	Feature-wise Linear Modulation+Gated Convolutional Unit
Input	Target

Setting	Method	Prediction
Threshold: -36 dB Ratio: 10:1	Extra input
	Gated Activation
	Feature-wise Linear Modulation+Gated Linear Unit
	Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Threshold: -3 dB Ratio: 1.5:1

Extra input

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit

Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Threshold: -20 dB Ratio: 4:1

Extra input

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit

Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Threshold: -36 dB Ratio: 10:1

Extra input

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit

Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Threshold: -3 dB Ratio: 1.5:1

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit - 1 order

Feature-wise Linear Modulation+Gated Linear Unit - 3 order

Feature-wise Linear Modulation+Gated Linear Unit - 5 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 1 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 3 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 5 order

Input

Target

Setting

Method

Prediction

Threshold: -20 dB Ratio: 4:1

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit - 1 order

Feature-wise Linear Modulation+Gated Linear Unit - 3 order

Feature-wise Linear Modulation+Gated Linear Unit - 5 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 1 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 3 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 5 order

Input

Target

Setting

Method

Prediction

Threshold: -36 dB Ratio: 10:1

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit - 1 order

Feature-wise Linear Modulation+Gated Linear Unit - 3 order

Feature-wise Linear Modulation+Gated Linear Unit - 5 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 1 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 3 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 5 order

Audio Examples - Overdrive [Post]



Input	Target

Setting	Method	Prediction
Drive: 10% Bright: 10%	Extra input
	Gated Activation
	Feature-wise Linear Modulation+Gated Linear Unit
	Feature-wise Linear Modulation+Gated Convolutional Unit
Input	Target

Setting	Method	Prediction
Drive: 45% Bright: 45%	Extra input
	Gated Activation
	Feature-wise Linear Modulation+Gated Linear Unit
	Feature-wise Linear Modulation+Gated Convolutional Unit
Input	Target

Setting	Method	Prediction
Drive: 100% Bright: 100%	Extra input
	Gated Activation
	Feature-wise Linear Modulation+Gated Linear Unit
	Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Drive: 10% Bright: 10%

Extra input

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit

Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Drive: 45% Bright: 45%

Extra input

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit

Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Drive: 100% Bright: 100%

Extra input

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit

Feature-wise Linear Modulation+Gated Convolutional Unit

Input

Target

Setting

Method

Prediction

Drive: 10% Bright: 10%

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit - 1 order

Feature-wise Linear Modulation+Gated Linear Unit - 3 order

Feature-wise Linear Modulation+Gated Linear Unit - 5 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 1 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 3 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 5 order

Input

Target

Setting

Method

Prediction

Drive: 45% Bright: 45%

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit - 1 order

Feature-wise Linear Modulation+Gated Linear Unit - 3 order

Feature-wise Linear Modulation+Gated Linear Unit - 5 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 1 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 3 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 5 order

Input

Target

Setting

Method

Prediction

Drive: 100% Bright: 100%

Gated Activation

Feature-wise Linear Modulation+Gated Linear Unit - 1 order

Feature-wise Linear Modulation+Gated Linear Unit - 3 order

Feature-wise Linear Modulation+Gated Linear Unit - 5 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 1 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 3 order

Feature-wise Linear Modulation+Gated Convolutional Unit - 5 order

@article{simionato2024hybrid, title={Conditioning Methods for Neural Audio Effects}, author={Simionato, Riccardo and Fasciani, Stefano}, booktitle={Proceedings of the International Conference on Sound and Music Computing}, year={2024} }

Conditioning Methods for Neural Audio Effects

Abstract

Datasets

Audio Examples - Compressor [Post]

Audio Examples - Overdrive [Post]

BibTeX