音频处理笔记 音频处理笔记1 介绍声音声音由空气压力的变化而产生。声音信号通常由不同频率的信号组合而成。 为了能够将声音输入模型中,我们需要将声波数字化,即将信号转换为一系列的数字。这是通过以固定时间间隔测量声音的振幅来完成的,即采样。采样率是每秒采样出的样本数,常见的采样率约为每秒44100个样本。 音频数据处理方式过去的音频机器学习应用程序依赖于传统的数字信号处理技术来提取特征。例如,用语音学概念分析音频 2023-02-22 深度学习 #笔记
Diffusion Model笔记 Diffusion Model笔记扩散过程对初始数据分布$x_0$~q(x),不断添加高斯噪声,最终使数据分布$X_T$变成各项独立的高斯分布。 前向扩散过程的定义 $q(x_t|x_{t-1})=N(x_t;\sqrt{1-\beta_t}x_{t-1},\beta_tI)$ $q(x_{1:T}|x_0)=\prod_{t=1}^Tq(x_t|x_{t-1})$(马尔科夫链过程) 通过重参 2023-02-02 深度学习 #笔记
GitHub+Hexo博客网站搭建(二) GitHub+Hexo博客网站搭建(二)图片无法正常加载Hexo网页无法正常加载图片 解决方法: _config.yml和主题的_config.theme.yml里的post_asset_folder设置为true(这样每篇文章都会有对应同名的文件夹,图片就放在这里面) npm install https://github.com/CodeFalling/hexo-asset-image -- 2022-11-11 GitHub个人网站搭建 #教程
Transformer笔记 Transformer笔记 Input EmbeddingOne-Hot Encoding将输入单词用one-hot形式编码成序列向量,向量长度就是预定义的词汇表中拥有的词汇量,向量在这一维中的值只有一个位置是1,其余都是0,1对应的位置就是词汇表中表示这个单词的地方 劣势:稀疏;长 Word Embedding设计一个可学习的权重矩阵W,将one-hot词向量与这个矩阵进行点乘,得到新 2022-11-11 深度学习 #笔记
GitHub+Hexo博客网站搭建(一) GitHub+Hexo博客网站搭建(一)弄一个自己的网站,可以放一些平时写的笔记或找到的资料什么的。 网站搭建网站的搭建其实很简单,在GitHub上新建一个repository,把名字命名为username.github.io就行。 网站有了,如何写文章?这里不需涉及到前端的编程。有一个叫框架的东西,可以帮我们实现前端,我们要做的就是写markdown就行了。我没用GitHub默认的框架,用的是H 2022-11-08 GitHub个人网站搭建 #教程