No OneTemporary
Actions

Size

26 KB

Subscribers

None

View Options

	diff --git a/AIMeiSheng/docker_demo/common.py b/AIMeiSheng/docker_demo/common.py
	index b9adb82..3ede6a6 100644
	--- a/AIMeiSheng/docker_demo/common.py
	+++ b/AIMeiSheng/docker_demo/common.py
	@@ -1,100 +1,101 @@
	import os
	import time
	# import logging
	import urllib, urllib.request

	# 测试/正式环境
	gs_prod = True

	gs_tmp_dir = "/tmp/ai_meisheng_tmp"
	gs_model_dir = "/tmp/ai_meisheng_models"
	gs_resource_cache_dir = "/tmp/ai_meisheng_resource_cache"
	gs_svc_model_path = os.path.join(gs_model_dir,
	"weights/xusong_v2_org_version_alldata_embed1_enzx_diff_fi_e15_s244110.pth")
	gs_embed_model_path = os.path.join(gs_model_dir, "RawNet3/models/weights/model.pt")
	gs_hubert_model_path = os.path.join(gs_model_dir, "hubert.pt")
	gs_rmvpe_model_path = os.path.join(gs_model_dir, "rmvpe.pt")

	# errcode
	gs_err_code_success = 0
	gs_err_code_download_vocal = 100
	gs_err_code_download_svc_url = 101
	gs_err_code_svc_process = 102
	gs_err_code_transcode = 103
	gs_err_code_volume_adjust = 104
	gs_err_code_upload = 105
	gs_err_code_params = 106
	gs_err_code_pending = 107
	+gs_err_code_target_silence = 108
	gs_err_code_too_many_connections = 429

	gs_redis_conf = {
	"host": "av-credis.starmaker.co",
	"port": 6379,
	"pwd": "lKoWEhz%jxTO",
	}

	gs_server_redis_conf = {
	"producer": "test_ai_meisheng_producer", # 输入的队列
	"ai_meisheng_key_prefix": "test_ai_meisheng_key_", # 存储结果情况
	}

	if gs_prod:
	gs_server_redis_conf = {
	"producer": "ai_meisheng_producer", # 输入的队列
	"ai_meisheng_key_prefix": "ai_meisheng_key_", # 存储结果情况
	}


	def download2disk(url, dst_path):
	urllib.request.urlretrieve(url, dst_path)
	return os.path.exists(dst_path)


	def exec_cmd(cmd):
	# gs_logger.info(cmd)
	print(cmd)
	ret = os.system(cmd)
	if ret != 0:
	return False
	return True


	def exec_cmd_and_result(cmd):
	r = os.popen(cmd)
	text = r.read()
	r.close()
	return text


	def upload_file2cos(key, file_path, region='ap-singapore', bucket_name='av-audit-sync-sg-1256122840'):
	"""
	将文件上传到cos
	:param key: 桶上的具体地址
	:param file_path: 本地文件地址
	:param region: 区域
	:param bucket_name: 桶地址
	:return:
	"""
	gs_coscmd = "coscmd"
	gs_coscmd_conf = "~/.cos.conf"

	cmd = "{} -c {} -r {} -b {} upload {} {}".format(gs_coscmd, gs_coscmd_conf, region, bucket_name, file_path, key)
	if exec_cmd(cmd):
	cmd = "{} -c {} -r {} -b {} info {}".format(gs_coscmd, gs_coscmd_conf, region, bucket_name, key) \
	+ "\| grep Content-Length \|awk \'{print $2}\'"
	res_str = exec_cmd_and_result(cmd)
	# logging.info("{},res={}".format(key, res_str))
	size = float(res_str)
	if size > 0:
	return True
	return False
	return False


	def check_input(input_data):
	key_list = ["record_song_url", "target_url", "start", "end", "vocal_loudness", "female_recording_url",
	"male_recording_url"]
	for key in key_list:
	if key not in input_data.keys():
	return False
	return True
	diff --git a/AIMeiSheng/docker_demo/offline_server.py b/AIMeiSheng/docker_demo/offline_server.py
	index 163413b..93b6d1e 100644
	--- a/AIMeiSheng/docker_demo/offline_server.py
	+++ b/AIMeiSheng/docker_demo/offline_server.py
	@@ -1,151 +1,153 @@
	# -- coding: UTF-8 --
	"""
	离线处理: 使用redis进行交互，从redis中获取数据资源，在将结果写入到redis
	"""
	import os
	import sys
	import time
	import json
	import socket
	import hashlib

	from redis_helper import RedisHelper
	from cos_helper import CosHelper
	from common import *
	import logging
	from svc_online import GSWorkerAttr, SVCOnline, volume_adjustment, svc_offline_logger

	sys.path.append(os.path.dirname(__file__))
	sys.path.append(os.path.join(os.path.dirname(__file__), "../"))


	def download_data(worker_attr):
	if os.path.exists(worker_attr.vocal_path):
	os.unlink(worker_attr.vocal_path)

	st = time.time()
	if not download2disk(worker_attr.vocal_url, worker_attr.vocal_path):
	return gs_err_code_download_vocal
	svc_offline_logger.info(f"download vocal_url={worker_attr.vocal_url} sp = {time.time() - st}")

	# download svc_source_url
	if not os.path.exists(worker_attr.female_svc_source_path):
	st = time.time()
	if not download2disk(worker_attr.female_svc_source_url, worker_attr.female_svc_source_path):
	return gs_err_code_download_svc_url
	svc_offline_logger.info(f"download female_url={worker_attr.female_svc_source_url} sp = {time.time() - st}")

	# download svc_source_url
	if not os.path.exists(worker_attr.male_svc_source_path):
	st = time.time()
	if not download2disk(worker_attr.male_svc_source_url, worker_attr.male_svc_source_path):
	return gs_err_code_download_svc_url
	svc_offline_logger.info(f"download male_url={worker_attr.male_svc_source_url} sp = {time.time() - st}")
	return gs_err_code_success


	def transcode(wav_path, dst_path):
	st = time.time()
	cmd = f"ffmpeg -i {wav_path} -ar 44100 -ac 2 -b:a 64k -y {dst_path} -loglevel fatal"
	exec_cmd(cmd)
	svc_offline_logger.info(f"transcode cmd={cmd}, sp = {time.time() - st}")
	return os.path.exists(dst_path)


	class OfflineServer:
	def __init__(self, redis_conf, server_conf, update_redis=False):
	st = time.time()
	self.redis_helper = RedisHelper(redis_conf)
	self.cos_helper = CosHelper()
	self.svc_online = SVCOnline()
	self.server_conf = server_conf
	self.distinct_key = server_conf["ai_meisheng_key_prefix"]
	self.update_redis = update_redis
	svc_offline_logger.info(f"config={redis_conf}---server_conf={self.server_conf}")
	svc_offline_logger.info(f"offline init finish sp={time.time() - st}")

	def exists(self):
	return self.redis_helper.exists(self.distinct_key)

	def update_result(self, errcode, schedule, gender, target_song_url):
	msg = {
	"status": errcode,
	"schedule": schedule,
	"gender": gender,
	"target_song_url": target_song_url,
	}
	# 结果保存15min
	if self.update_redis:
	self.redis_helper.set(self.distinct_key, json.dumps(msg))
	self.redis_helper.expire(self.distinct_key, 60 * 10)

	def process_one(self, worker_attr):
	self.distinct_key = self.server_conf["ai_meisheng_key_prefix"] + worker_attr.distinct_id
	svc_offline_logger.info(f"{worker_attr.log_info_name()}, start download ...")
	err = download_data(worker_attr)
	if err != gs_err_code_success:
	self.update_result(err, 100, "unknown", worker_attr.target_url)
	return err, None, None
	self.update_result(err, 35, "unknown", worker_attr.target_url)

	svc_offline_logger.info(f"{worker_attr.log_info_name()}, start process ...")
	- gender = self.svc_online.process(worker_attr)
	+ gender, err_code = self.svc_online.process(worker_attr)
	+ if err_code == gs_err_code_target_silence : #unvoice err
	+ return gs_err_code_target_silence, None, None
	if not os.path.exists(worker_attr.target_wav_path):
	self.update_result(gs_err_code_svc_process, 100, gender, worker_attr.target_url)
	return gs_err_code_svc_process, None, None
	self.update_result(err, 85, gender, worker_attr.target_url)

	# 音量拉伸到指定响度
	svc_offline_logger.info(f"{worker_attr.log_info_name()}, start volume_adjustment ...")
	volume_adjustment(worker_attr.target_wav_path, worker_attr.target_loudness, worker_attr.target_wav_ad_path)
	if not os.path.exists(worker_attr.target_wav_ad_path):
	self.update_result(gs_err_code_volume_adjust, 100, gender, worker_attr.target_url)
	return gs_err_code_volume_adjust, None, None
	self.update_result(err, 90, gender, worker_attr.target_url)

	# transcode
	svc_offline_logger.info(f"{worker_attr.log_info_name()}, start transcode ...")
	if not transcode(worker_attr.target_wav_path, worker_attr.target_path):
	self.update_result(gs_err_code_transcode, 100, gender, worker_attr.target_url)
	return gs_err_code_transcode, None, None
	self.update_result(err, 95, gender, worker_attr.target_url)

	# upload
	svc_offline_logger.info(f"{worker_attr.log_info_name()}, start upload_file2cos ...")
	st = time.time()
	if not self.cos_helper.upload_by_url(worker_attr.target_path, worker_attr.target_url):
	self.update_result(gs_err_code_upload, 100, gender, worker_attr.target_url)
	return gs_err_code_upload, None, None
	self.update_result(gs_err_code_success, 100, gender, worker_attr.target_url)
	svc_offline_logger.info(f"{worker_attr.log_info_name()} upload {worker_attr.target_url} sp = {time.time() - st}")
	return gs_err_code_success, worker_attr.target_url, gender

	def process(self):
	while True:
	data = self.redis_helper.rpop(self.server_conf["producer"])
	if data is None:
	time.sleep(1)
	continue

	data = json.loads(data)
	if not check_input(data):
	svc_offline_logger.error(f"input data error={data}")
	continue

	worker_attr = GSWorkerAttr(data)
	self.distinct_key = self.server_conf["ai_meisheng_key_prefix"] + worker_attr.distinct_id
	if not self.exists():
	svc_offline_logger.warning(f"input {data}, timeout abandon ....")
	worker_attr.rm_cache()
	continue

	st = time.time()
	errcode, target_path, gender = self.process_one(worker_attr)
	self.update_result(errcode, 100, gender, target_path)
	svc_offline_logger.info(f"{worker_attr.log_info_name()} finish sp = {time.time() - st}")
	worker_attr.rm_cache()


	if __name__ == '__main__':
	offline_server = OfflineServer(gs_redis_conf, gs_server_redis_conf, True)
	offline_server.process()
	diff --git a/AIMeiSheng/docker_demo/svc_online.py b/AIMeiSheng/docker_demo/svc_online.py
	index fa16544..76a1fe9 100644
	--- a/AIMeiSheng/docker_demo/svc_online.py
	+++ b/AIMeiSheng/docker_demo/svc_online.py
	@@ -1,180 +1,181 @@
	# -- coding: UTF-8 --
	"""
	SVC的核心处理逻辑
	"""
	import os
	import time
	import socket
	import shutil
	import hashlib

	from AIMeiSheng.meisheng_svc_final import load_model, process_svc_online
	from AIMeiSheng.meisheng_env_preparex import meisheng_env_prepare
	from AIMeiSheng.voice_classification.online.voice_class_online_fang import VoiceClass, download_volume_balanced

	from AIMeiSheng.docker_demo.common import *

	import logging

	hostname = socket.gethostname()
	log_file_name = f"{os.path.dirname(os.path.abspath(__file__))}/av_meisheng_{hostname}.log"

	# 设置logger
	svc_offline_logger = logging.getLogger("svc_offline")
	file_handler = logging.FileHandler(log_file_name)
	file_handler.setLevel(logging.INFO)
	formatter = logging.Formatter('%(asctime)s %(levelname)s %(message)s', datefmt='%Y-%m-%d %I:%M:%S')
	file_handler.setFormatter(formatter)
	if gs_prod:
	svc_offline_logger.addHandler(file_handler)

	if os.path.exists(gs_tmp_dir):
	shutil.rmtree(gs_tmp_dir)

	os.makedirs(gs_model_dir, exist_ok=True)
	os.makedirs(gs_resource_cache_dir, exist_ok=True)

	# 预设参数
	gs_gender_models_url = "https://av-audit-sync-sg-1256122840.cos.ap-singapore.myqcloud.com/hub/voice_classification/models.zip"
	gs_volume_bin_url = "https://av-audit-sync-sg-1256122840.cos.ap-singapore.myqcloud.com/dataset/AIMeiSheng/ebur128_tool"


	class GSWorkerAttr:
	def __init__(self, input_data):
	# 取出输入资源
	vocal_url = input_data["record_song_url"]
	target_url = input_data["target_url"]
	start = input_data["start"] # 单位是ms
	end = input_data["end"] # 单位是ms
	vocal_loudness = input_data["vocal_loudness"]
	female_recording_url = input_data["female_recording_url"]
	male_recording_url = input_data["male_recording_url"]

	self.distinct_id = hashlib.md5(vocal_url.encode()).hexdigest()
	self.tmp_dir = os.path.join(gs_tmp_dir, self.distinct_id)
	if os.path.exists(self.tmp_dir):
	shutil.rmtree(self.tmp_dir)
	os.makedirs(self.tmp_dir)

	self.vocal_url = vocal_url
	self.target_url = target_url

	ext = vocal_url.split(".")[-1]
	self.vocal_path = os.path.join(self.tmp_dir, self.distinct_id + f"_in.{ext}")
	self.target_wav_path = os.path.join(self.tmp_dir, self.distinct_id + "_out.wav")
	self.target_wav_ad_path = os.path.join(self.tmp_dir, self.distinct_id + "_out_ad.wav")
	self.target_path = os.path.join(self.tmp_dir, self.distinct_id + "_out.m4a")

	self.female_svc_source_url = female_recording_url
	self.male_svc_source_url = male_recording_url

	ext = female_recording_url.split(".")[-1]
	self.female_svc_source_path = os.path.join(gs_resource_cache_dir,
	hashlib.md5(female_recording_url.encode()).hexdigest() + "." + ext)
	ext = male_recording_url.split(".")[-1]
	self.male_svc_source_path = os.path.join(gs_resource_cache_dir,
	hashlib.md5(male_recording_url.encode()).hexdigest() + "." + ext)
	self.st_tm = start
	self.ed_tm = end
	self.target_loudness = vocal_loudness

	def log_info_name(self):
	return f"d_id={self.distinct_id}, vocal_url={self.vocal_url}"

	def rm_cache(self):
	if os.path.exists(self.tmp_dir):
	shutil.rmtree(self.tmp_dir)


	def init_gender_model():
	"""
	下载模型
	:return:
	"""
	dst_model_dir = os.path.join(gs_model_dir, "voice_classification")
	if not os.path.exists(dst_model_dir):
	dst_zip_path = os.path.join(gs_model_dir, "models.zip")
	if not download2disk(gs_gender_models_url, dst_zip_path):
	svc_offline_logger.fatal(f"download gender_model err={gs_gender_models_url}")
	cmd = f"cd {gs_model_dir}; unzip {dst_zip_path}; mv models voice_classification; rm -f {dst_zip_path}"
	os.system(cmd)
	if not os.path.exists(dst_model_dir):
	svc_offline_logger.fatal(f"unzip {dst_zip_path} err")

	music_voice_pure_model = os.path.join(dst_model_dir, "voice_005_rec_v5.pth")
	music_voice_no_pure_model = os.path.join(dst_model_dir, "voice_10_v5.pth")
	gender_pure_model = os.path.join(dst_model_dir, "gender_8k_ratev5_v6_adam.pth")
	gender_no_pure_model = os.path.join(dst_model_dir, "gender_8k_v6_adam.pth")
	vc = VoiceClass(music_voice_pure_model, music_voice_no_pure_model, gender_pure_model, gender_no_pure_model)
	return vc


	def init_svc_model():
	meisheng_env_prepare(logging, gs_model_dir)
	embed_model, hubert_model = load_model()
	return embed_model, hubert_model


	def download_volume_adjustment():
	"""
	下载音量调整工具
	:return:
	"""
	volume_bin_path = os.path.join(gs_model_dir, "ebur128_tool")
	if not os.path.exists(volume_bin_path):
	if not download2disk(gs_volume_bin_url, volume_bin_path):
	svc_offline_logger.fatal(f"download volume_bin err={gs_volume_bin_url}")
	os.system(f"chmod +x {volume_bin_path}")


	def volume_adjustment(wav_path, target_loudness, out_path):
	"""
	音量调整
	:param wav_path:
	:param target_loudness:
	:param out_path:
	:return:
	"""
	volume_bin_path = os.path.join(gs_model_dir, "ebur128_tool")
	cmd = f"{volume_bin_path} {wav_path} {target_loudness} {out_path}"
	os.system(cmd)


	class SVCOnline:

	def __init__(self):
	st = time.time()
	self.gender_model = init_gender_model()
	self.embed_model, self.hubert_model = init_svc_model()
	download_volume_adjustment()
	download_volume_balanced()
	svc_offline_logger.info(f"svc init finished, sp = {time.time() - st}")

	def gender_process(self, worker_attr):
	st = time.time()
	gender, female_rate, is_pure = self.gender_model.process(worker_attr.vocal_path)
	svc_offline_logger.info(
	f"{worker_attr.vocal_url}, gender={gender}, female_rate={female_rate}, is_pure={is_pure}, "
	f"gender_process sp = {time.time() - st}")
	if gender == 0:
	gender = 'female'
	elif gender == 1:
	gender = 'male'
	elif female_rate > 0.5:
	gender = 'female'
	else:
	gender = 'male'
	svc_offline_logger.info(f"{worker_attr.vocal_url}, modified gender={gender}")
	return gender

	def process(self, worker_attr):
	gender = self.gender_process(worker_attr)
	song_path = worker_attr.female_svc_source_path
	if gender == "male":
	song_path = worker_attr.male_svc_source_path
	params = {'gender': gender, 'tst': worker_attr.st_tm, "tnd": worker_attr.ed_tm, 'delay': 0, 'song_path': None}
	st = time.time()
	- similar = process_svc_online(song_path, worker_attr.vocal_path, worker_attr.target_wav_path, self.embed_model,
	+ err_code = process_svc_online(song_path, worker_attr.vocal_path, worker_attr.target_wav_path, self.embed_model,
	self.hubert_model, params)
	- svc_offline_logger.info(f"{worker_attr.vocal_url}, similar={similar} process svc sp = {time.time() - st}")
	- return gender
	+
	+ svc_offline_logger.info(f"{worker_attr.vocal_url}, err_code={err_code} process svc sp = {time.time() - st}")
	+ return gender, err_code
	diff --git a/AIMeiSheng/meisheng_svc_final.py b/AIMeiSheng/meisheng_svc_final.py
	index d3de54d..e6e1ec2 100644
	--- a/AIMeiSheng/meisheng_svc_final.py
	+++ b/AIMeiSheng/meisheng_svc_final.py
	@@ -1,222 +1,224 @@
	import os
	import sys

	sys.path.append(os.path.dirname(__file__))

	import time
	import shutil
	import glob
	import hashlib
	import librosa
	import soundfile
	import gradio as gr
	import pandas as pd
	import numpy as np
	from AIMeiSheng.RawNet3.infererence_fang_meisheng import get_embed, get_embed_model
	from myinfer_multi_spk_embed_in_dec_diff_fi_meisheng import svc_main, load_hubert, get_vc, get_rmvpe
	from gender_classify import load_gender_model
	-from AIMeiSheng.docker_demo.common import gs_svc_model_path, gs_embed_model_path, gs_rmvpe_model_path
	+from AIMeiSheng.docker_demo.common import gs_svc_model_path, gs_embed_model_path, gs_rmvpe_model_path, gs_err_code_target_silence

	gs_simple_mixer_path = "/data/gpu_env_common/bin/simple_mixer" ##混音执行文件
	tmp_workspace_name = "batch_test_ocean_fi" # 工作空间名
	song_folder = "./data_meisheng/" ##song folder
	gs_work_dir = f"./data_meisheng/{tmp_workspace_name}" # 工作空间路径
	pth_model_path = "./weights/xusong_v2_org_version_alldata_embed1_enzx_diff_fi_e15_s244110.pth" ##模型文件

	cur_dir = os.path.abspath(os.path.dirname(__file__))
	abs_path = os.path.join(cur_dir, song_folder, tmp_workspace_name) + '/'

	f0_method = None


	def mix(in_path, acc_path, dst_path):
	# svc转码到442
	svc_442_file = in_path + "_442.wav"
	st = time.time()
	cmd = "ffmpeg -i {} -ar 44100 -ac 2 -y {} -loglevel fatal".format(in_path, svc_442_file)
	os.system(cmd)
	if not os.path.exists(svc_442_file):
	return -1
	print("transcode,{},sp={}".format(in_path, time.time() - st))

	# 混合
	st = time.time()
	cmd = "{} {} {} {} 1".format(gs_simple_mixer_path, svc_442_file, acc_path, dst_path)
	os.system(cmd)
	print("mixer,{},sp={}".format(in_path, time.time() - st))


	def load_model():
	global f0_method
	embed_model = get_embed_model(gs_embed_model_path)
	hubert_model = load_hubert()
	get_vc(gs_svc_model_path)
	f0_method = get_rmvpe(gs_rmvpe_model_path)
	print("model preload finish!!!")
	return embed_model, hubert_model # ,svc_model


	def meisheng_init():
	embed_model, hubert_model = load_model() ##提前加载模型
	gender_model = load_gender_model()
	return embed_model, hubert_model, gender_model


	def pyin_process_single_rmvpe(input_file):
	global f0_method
	if f0_method is None:
	f0_method = get_rmvpe()

	rate = 16000 # 44100
	# 读取音频文件
	y, sr = librosa.load(input_file, sr=rate)
	len_s = len(y) / sr
	lim_s = 15 # 10
	if (len_s > lim_s):
	y1 = y[:sr * lim_s]
	y2 = y[-sr * lim_s:]
	f0 = f0_method.infer_from_audio(y1, thred=0.03)
	f0 = f0[f0 < 600]
	valid_f0 = f0[f0 > 50]
	mean_pitch1 = np.mean(valid_f0)
	f0 = f0_method.infer_from_audio(y2, thred=0.03)
	f0 = f0[f0 < 600]
	valid_f0 = f0[f0 > 50]
	mean_pitch2 = np.mean(valid_f0)

	if abs(mean_pitch1 - mean_pitch2) > 55:
	mean_pitch_cur = min(mean_pitch1, mean_pitch2)
	else:
	mean_pitch_cur = (mean_pitch1 + mean_pitch2) / 2

	else:
	f0 = f0_method.infer_from_audio(y, thred=0.03)
	f0 = f0[f0 < 600]
	valid_f0 = f0[f0 > 50]
	mean_pitch_cur = np.mean(valid_f0)

	return mean_pitch_cur


	def meisheng_svc(song_wav, target_wav, svc_out_path, embed_npy, embed_md, hubert_md, paras):
	##计算pitch
	f0up_key = pyin_process_single_rmvpe(target_wav)
	+ if f0up_key < 40 or np.isnan(f0up_key):#unvoice
	+ return gs_err_code_target_silence
	## get embed, 音色
	get_embed(target_wav, embed_npy, embed_md)

	print("svc main start...")
	svc_main(song_wav, svc_out_path, embed_npy, f0up_key, hubert_md, paras)
	print("svc main finished!!")

	return 0


	def process_svc_online(song_wav, target_wav, svc_out_path, embed_md, hubert_md, paras):
	embed_npy = target_wav[:-4] + '.npy' ##embd npy存储位置
	- similar = meisheng_svc(song_wav, target_wav, svc_out_path, embed_npy, embed_md, hubert_md, paras)
	+ err_code = meisheng_svc(song_wav, target_wav, svc_out_path, embed_npy, embed_md, hubert_md, paras)

	- return similar
	+ return err_code


	def process_svc(song_wav, target_wav, svc_out_path, embed_md, hubert_md, paras):
	song_wav1, target_wav, svc_out_path = os.path.basename(song_wav), os.path.basename(
	target_wav), os.path.basename(svc_out_path) # 绝对路径
	song_wav, target_wav, svc_out_path = song_wav, abs_path + target_wav, abs_path + svc_out_path
	embed_npy = target_wav[:-4] + '.npy' ##embd npy存储位置

	# similar = meisheng_svc(song_wav,target_wav,svc_out_path,embed_npy,paras)
	similar = meisheng_svc(song_wav, target_wav, svc_out_path, embed_npy, embed_md, hubert_md, paras)

	return similar


	def get_svc(target_yinse_wav, song_name, embed_model, hubert_model, paras):
	'''
	:param target_yinse_wav: 目标音色
	:param song_name: 歌曲名字
	;param paras: 其他参数
	:return: svc路径名
	'''

	##清空工作空间临时路径
	if os.path.exists(gs_work_dir):
	# shutil.rmtree(gs_work_dir)
	cmd = f"rm -rf {gs_work_dir}/*"
	os.system(cmd)
	else:
	os.makedirs(gs_work_dir)

	gender = paras['gender'] ##为了确定歌曲

	##目标音色读取
	f_dst = os.path.join(gs_work_dir, os.path.basename(target_yinse_wav))
	# print("dir :", f_dst,"target_yinse_wav:",target_yinse_wav)
	# shutil.move(target_yinse_wav, f_dst) ##放在工作目录
	shutil.copy(target_yinse_wav, f_dst)
	target_yinse_wav = f_dst

	##歌曲/伴奏读取（路径需要修改）
	song_wav = os.path.join("{}{}/{}/vocal321.wav".format(song_folder, gender, song_name)) # 歌曲vocal
	inf_acc_path = os.path.join("{}{}/{}/acc.wav".format(song_folder, gender, song_name))
	# song_wav = './xusong_long.wav'
	svc_out_path = os.path.join(gs_work_dir, "svc.wav") ###svc结果名字
	print("inputMsg:", song_wav, target_yinse_wav, svc_out_path)

	## svc process
	st = time.time()
	print("start inference...")
	similar = process_svc(song_wav, target_yinse_wav, svc_out_path, embed_model, hubert_model, paras)
	print("svc finished!!")
	print("time cost = {}".format(time.time() - st))
	print("out path name {} ".format(svc_out_path))

	# '''
	##加混响
	print("add reverbration...")
	svc_out_path_effect = svc_out_path[:-4] + '_effect.wav'
	cmd = f"/data/gpu_env_common/bin/effect_tool {svc_out_path} {svc_out_path_effect}"
	print("cmd :", cmd)
	os.system(cmd)
	# # 人声伴奏合并
	print("add acc...")
	out_path = svc_out_path_effect[:-4] + '_music.wav'
	mix(svc_out_path_effect, inf_acc_path, out_path)

	print("time cost = {}".format(time.time() - st))
	print("out path name {} ".format(out_path))
	# '''

	return svc_out_path


	def meisheng_func(target_yinse_wav, song_name, paras):
	##init
	embed_model, hubert_model, gender_model = meisheng_init()

	###gender predict
	gender, female_rate, is_pure = gender_model.process(target_yinse_wav)
	print('=====================')
	print("gender:{}, female_rate:{},is_pure:{}".format(gender, female_rate, is_pure))
	if gender == 0:
	gender = 'female'
	elif gender == 1:
	gender = 'male'
	elif female_rate > 0.5:
	gender = 'female'
	else:
	gender = 'male'
	print("modified gender:{} ".format(gender))
	print('=====================')

	##美声main
	paras['gender'] = gender ##单位都是ms
	get_svc(target_yinse_wav, song_name, embed_model, hubert_model, paras)


	if __name__ == '__main__':
	# target_yinse_wav = "./raw/meisheng_yinse/female/changying.wav" # 需要完整路径
	target_yinse_wav = "./raw/meisheng_yinse/female/target_yinse_cloris.m4a"
	song_name = "lost_stars" ##歌曲名字
	paras = {'gender': None, 'tst': 0, "tnd": None, 'delay': 0, 'song_path': None}
	# paras = {'gender': 'female', 'tst': 0, "tnd": 30, 'delay': 0} ###片段svc测试
	meisheng_func(target_yinse_wav, song_name, paras)

File Metadata

Mime Type: text/x-diff
Expires: Sun, Jan 12, 08:34 (1 d, 12 h)
Storage Engine: blob
Storage Format: Raw Data
Storage Handle: 1347201
Default Alt Text: (26 KB)

No OneTemporaryActions

View Options

File Metadata

Event Timeline

No OneTemporary
Actions