又见苍岚

科大讯飞语音识别

之前介绍了百度语音识别 API 的调用方法，本文记录科大讯飞 API 的使用方法。

2023-06-28

Audio

#Audio

声纹识别 ECAPA-TDNN

声纹识别是指利用声音特征对说话人的身份进行识别的生物识别技术，已有几十年的发展历史，但直到深度学习兴起之后才开始广泛应用。本文记录当前主流声纹模型 ECAPA-TDNN。

2023-06-26

Audio

#Audio

Meta 自监督学习 I-JEPA 论文笔记

Meta 宣布推出一个全新的 AI 模型 Image Joint Embedding Predictive Architecture (I-JEPA)，可通过对图像的自我监督学习来学习世界的抽象表征，实现比现有模型更准确地分析和完成未完成的图像。

2023-06-25

Deep_Learning > Self_Supervised_Learning

#Deep_Learning #Self_Supervised_Learning

调用 Baidu 语音识别接口识别短句

语音识别已经是很成熟的技术了，本文记录调用百度 API 实现语音识别的过程。

2023-06-20

Audio

#Audio

修改 wav 音频采样率

语音识别时指定采样率 16k，本文记录使用 python 实现音频采样率改变的过程。

2023-06-20

Audio

#Audio

降维方法 PCA、t-sne、Umap 的 python 实现

本文介绍三种常用降维方法 PCA、t-sne、Umap 的 Python 实现。

2023-06-19

Machine_Learning

#Machine_Learning

Hexo -48- 文章隐藏

Hexo 博客有时有着想要发布，但是不想过于公开的场景，本文记录隐藏 Hexo 博客的技术实现。

2023-06-15

Hexo > Website

#Hexo #Website

常用聚类算法

聚类或聚类分析是无监督学习问题，常被用于数据分析，本文记录聚类问题定义，以及常用聚类算法和实现。

2023-05-26

Algorithm > Clustering

#Python #Algorithm #Clustering

原神——提瓦特大陆语音提取解析

语音训练需要优质的数据，我们尝试使用原神中的语音进行训练，首先需要提取并解析其中的语音信息。

2023-05-24

Audio

#Audio

Normalizing Flow 理解与实现

前文介绍了标准化流 ,本文做简单尝试加深理解。

2023-05-23

Deep_Learning > Generation_Model

#Deep_Learning #Generation_Model