readme.md
No OneTemporary
Actions

Size

1 KB

Subscribers

None

readme.md
View Options

	#男女声识别

	```
	模型名称以及对应作用:
	---gender_8k_ratev5_v6_adam.pth // 男女声(纯人声)分类模型(使用8k纯人声数据集进行训练,mobilenet_v2,adam优化器)
	---gender_8k_v6_adam.pth // 男女声(带人声)分类模型(使用8k带人声数据集进行训练,mobilenet_v2,adam优化器)
	---voice_005_rec_v5.pth // 纯人声分类模型(400首人工标注的歌曲,判定纯人声段(使用作品中带人声段当作负样本) mobilenet_v1, sgd优化器)
	---voice_10_v5.pth // 带人声分类模型(400首人工标注的歌曲,判定带人声段, mobilenet_v1, sgd优化器)
	模型地址:https://av-audit-sync-in-1256122840.cos.ap-mumbai.myqcloud.com/hub/voice_classification/models.zip
	```

	# 文件说明
	```
	---common.py // 用于绑定核心的代码
	---mobilenet_v2_custom.py // 模型代码
	---model.py // 调用模型的封装层
	---readme.MD // 说明文件
	---voice_class_online.py // 运行时使用的文件
	```

	# 环境安装
	```
	cd /home/worker
	wget "https://av-audit-sync-in-1256122840.cos.ap-mumbai.myqcloud.com/hub/voice_classification/bin/bin.zip"
	unzip bin.zip
	rm -f bin.zip
	export PATH=$PATH:/home/worker/bin # 需要写入到.zshrc中
	sudo yum install libsndfile-devel

	# 以下使用手动安装即可
	conda create -n voice_class python=3.7 -y
	conda activate voice_class
	pip3 install librosa
	pip3 install psutil
	pip3 install torch==1.5 torchvision torchaudio
	```

	# 使用说明
	```
	下载模型并解压后,按照voice_class_online.py中的运行方式运行即可
	```

	# 注意:
	目前代码中限制了CPU的核心数量,只允许占用一个核,建议根据核心的情况多开几个进程做处理

	# 性能测试(不加性能限制的情况下在GPU-2机器上测试得到):
	20个线上样本(男10,女10)

	CPU情况:spend_time:tot=31.91\|transcode=5.92\|vb=3.12\|gen_feature=3.5\|predict=18.94
	GPU情况:spend_time:tot=15.64\|transcode=6.34\|vb=4.17\|gen_feature=3.3\|predict=1.443

File Metadata

Mime Type: text/plain
Expires: Sat, Jun 21, 02:53 (1 d, 2 h)
Storage Engine: blob
Storage Format: Raw Data
Storage Handle: 1447915
Default Alt Text: readme.md (1 KB)

readme.mdNo OneTemporaryActions

readme.mdView Options

File Metadata

Event Timeline

readme.md
No OneTemporary
Actions

readme.md
View Options