HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks

Last update: Dec 27, 2022

HiFiGAN Denoiser

This is a Unofficial Pytorch implementation of the paper HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks.

Citations

@misc{su2020hifigan,
      title={HiFi-GAN: High-Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks}, 
      author={Jiaqi Su and Zeyu Jin and Adam Finkelstein},
      year={2020},
      eprint={2006.05694},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}

Requirement

Tested on Python 3.6

pip install -r requirements.txt

Train & Tensorboard

python train.py -c [config yaml file]
tensorboard --logdir log_dir

Inference

python inference.py -p [checkpoint path] -i [input wav path]

Checkpoint :

References

HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks
Denoising Wavenet Generator
StarGAN VC Discriminator
Melgan Multi-Scale Discriminator
Parallel Wavegan
HiFi GAN vocoder's MSD and multi-gpu training code

HiFi-GAN: High Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks

Related tags

Overview

HiFiGAN Denoiser

Citations

Requirement

Train & Tensorboard

Inference

Checkpoint :

References

Owner

Rishikesh (ऋषिकेश)

catch-22: CAnonical Time-series CHaracteristics

Softlearning is a reinforcement learning framework for training maximum entropy policies in continuous domains. Includes the official implementation of the Soft Actor-Critic algorithm.

Object detection (YOLO) with pytorch, OpenCV and python

This is the official implementation of "One Question Answering Model for Many Languages with Cross-lingual Dense Passage Retrieval".

A Real-Time-Strategy game for Deep Learning research

Intel® Neural Compressor is an open-source Python library running on Intel CPUs and GPUs

Spontaneous Facial Micro Expression Recognition using 3D Spatio-Temporal Convolutional Neural Networks

quantize aware training package for NCNN on pytorch

code for our ECCV-2020 paper: Self-supervised Video Representation Learning by Pace Prediction

Generate indoor scenes with Transformers

CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification (ICCV2021)

Implementation of accepted AAAI 2021 paper: Deep Unsupervised Image Hashing by Maximizing Bit Entropy

World Models with TensorFlow 2

Controlling Hill Climb Racing with Hand Tacking

Repository for "Space-Time Correspondence as a Contrastive Random Walk" (NeurIPS 2020)

FLVIS: Feedback Loop Based Visual Initial SLAM

Normal Learning in Videos with Attention Prototype Network

An implementation of RetinaNet in PyTorch.

This is the repository for The Machine Learning Workshops, published by AI DOJO

[CVPR 2020] 3D Photography using Context-aware Layered Depth Inpainting