Page Menu
Home
Phabricator
Search
Configure Global Search
Log In
Files
F5051403
readme.md
No One
Temporary
Actions
View File
Edit File
Delete File
View Transforms
Subscribe
Mute Notifications
Award Token
Flag For Later
Size
1 KB
Subscribers
None
readme.md
View Options
#
男女声识别
```
模型名称以及对应作用
:
---
gender_8k_ratev5_v6_adam
.
pth
// 男女声(纯人声)分类模型(使用8k纯人声数据集进行训练,mobilenet_v2,adam优化器)
---
gender_8k_v6_adam
.
pth
// 男女声(带人声)分类模型(使用8k带人声数据集进行训练,mobilenet_v2,adam优化器)
---
voice_005_rec_v5
.
pth
// 纯人声分类模型(400首人工标注的歌曲,判定纯人声段(使用作品中带人声段当作负样本) mobilenet_v1, sgd优化器)
---
voice_10_v5
.
pth
// 带人声分类模型(400首人工标注的歌曲,判定带人声段, mobilenet_v1, sgd优化器)
模型地址
:
https
:
//av-audit-sync-in-1256122840.cos.ap-mumbai.myqcloud.com/hub/voice_classification/models.zip
```
#
文件说明
```
---
common
.
py
// 用于绑定核心的代码
---
mobilenet_v2_custom
.
py
// 模型代码
---
model
.
py
// 调用模型的封装层
---
readme
.
MD
// 说明文件
---
voice_class_online
.
py
// 运行时使用的文件
```
#
环境安装
```
cd
/
home
/
worker
wget
"https://av-audit-sync-in-1256122840.cos.ap-mumbai.myqcloud.com/hub/voice_classification/bin/bin.zip"
unzip
bin
.
zip
rm
-
f
bin
.
zip
export
PATH
=$
PATH
:/
home
/
worker
/
bin
#
需要写入到
.
zshrc
中
sudo
yum
install
libsndfile
-
devel
#
以下使用手动安装即可
conda
create
-
n
voice_class
python
=
3.7
-
y
conda
activate
voice_class
pip3
install
librosa
pip3
install
psutil
pip3
install
torch
==
1.5
torchvision
torchaudio
```
#
使用说明
```
下载模型并解压后
,
按照
voice_class_online
.
py
中的运行方式运行即可
```
#
注意
:
目前代码中限制了
CPU
的核心数量
,
只允许占用一个核
,
建议根据核心的情况多开几个进程做处理
#
性能测试
(
不加性能限制的情况下在
GPU
-
2
机器上测试得到
):
20
个线上样本
(
男
10
,
女
10
)
CPU
情况
:
spend_time
:
tot
=
31.91
|
transcode
=
5.92
|
vb
=
3.12
|
gen_feature
=
3.5
|
predict
=
18.94
GPU
情况
:
spend_time
:
tot
=
15.64
|
transcode
=
6.34
|
vb
=
4.17
|
gen_feature
=
3.3
|
predict
=
1.443
File Metadata
Details
Attached
Mime Type
text/plain
Expires
Sat, Jun 21, 02:53 (1 d, 2 h)
Storage Engine
blob
Storage Format
Raw Data
Storage Handle
1447915
Default Alt Text
readme.md (1 KB)
Attached To
R350 av_svc
Event Timeline
Log In to Comment