HieDean

Memento mori

GAN for Speech Enhancement

[TOC] SEGAN: Speech Enhancement Generative Adversarial Network INTERSPEECH 2017 Universitat Politecnica de Catalunya, Barcelona, Spain (西班牙,巴塞罗那,加泰罗尼亚理工大学) G的结构 含有SkipCon...

文献阅读: Speech Denoising With Deep Feature Losses

这篇文章提出了两个模型,一个是denoising network,一个是loss network,其中denoising network用于语音增强,loss network是在经过预训练后用于计算deep feature loss Denoising Network denoising network的输入与输出均为waveform,即end-to-end模型...

实验室简易装机手册

制作U盘启动盘 首先需要在官网(https://ubuntu.com)下载ubuntu镜像并制作U盘启动盘,本文在写时ubuntu系统已更新至20.04LTS版本,但为了保证服务器稳定性,建议下载18.04LTS版或16.04LTS版。 制作U盘启动盘 我所使用的软件是rufus,制作U盘启动盘的软件很多,可自行选择,这里以rufus为例 ...

文献阅读: Speech Enhancement Using Forked Generative Adversarial Networks with Spectral Subtraction

理解 这篇文章提出的模型叫S-ForkGAN,该模型工作在log-power spectra上,模型结构如下图所示: 1帧语音波形经过512点FFT并被转换为257点log-power spectra 11帧的log-power spectra被拼接在一起构成2827$\times$1的vector作为encoder的输入 ...

文献阅读: Speech Enhancement

On Training Targets for Supervised Speech Separation 这篇文章让我大概了解了目前这个邻域的一些技术与做法。 首先要区分语音增强(Speech Enhancement)、语音分离(Speech Separation)、语音解混响(Speech Dereverberation),这三者的目的是有区别的,但使用的方法却...

文献阅读: A Phase-and-Harmonics-Aware Speech Enhancement Network

总览 单通道的语音降噪有两种方式: 直接在一维的时域原始波形上进行操作 把一维的时域波形转换为二维的时频谱再进行操作 第二种方式的主流方法是预测一个时频掩膜用来降噪,PHASEN也是采用这种方法。 总的来说,PHASEN是在时频谱(复数域)基础上预测了一个幅度掩膜$M$和一个相位掩膜$\psi$,然后用输入的时频谱的模(实数域)乘上两个掩膜得到低噪声...

pytorch 问题汇总

RuntimeError:running_mean should contain 12 elements not 3084 检查一下nn.BatchNorm2d(channels)的channels是否设置正确 训练时出现 Warning:NaN or Inf found in input tensor 查了查说是因为梯度爆炸或梯度消失,也就是梯度过大或梯度过小。看看模型的参数哪个设置的不...

pytorch中的tensorboardx安装及简单使用

安装 pip install tensorflow pip install tensorboardx 据说tensorboardx是基于tensorflow的tensorboard的所以要先安装tensorflow 简单使用 from tensorboardX import SummaryWriter writer = SummaryWriter() # ... writer.a...

独立显卡的专用内存与共享内存

参考https://zhuanlan.zhihu.com/p/36575387 专用GPU内存 独显是指单独的GPU PCIe卡,在它上面有单独的GDDR内存,而这里的专有GPU内存就是指该GPU显卡上自带的内存,它只能够被GPU使用,而且带宽很高,延迟很小。 共享GPU内存 是操作系统Windows从系统内存中划出来,优先给GPU使用的内存。 GPU内存 即GPU可用内存=共享G...

ubuntu维护日常

复制文件 cp [选项] 源文件 目标文件 .sh文件的运行 sh xx.sh 查看进程杀死进程 ps 通过pid查看进程 ps -ef|grep pid 杀死进程 kill -9 [PID] 查看显卡状态 nvidia-smi linux下可以使用该命令实时监控显卡状态 watch -n 1 nvidia-smi(其中数字1是1秒刷新一次) 查看CPU占用率、内存占用率 top...