🎵VIETNAMESE RVC🎵
Công cụ huấn luyện, chuyển đổi giọng nói chất lượng và hiệu suất cao đơn giản
Tách Nhạc
Một hệ thống tách nhạc đơn giản có thể tách được 4 phần: Nhạc, giọng, giọng chính, giọng bè
Âm thanh đã được tách
Chuyển Đổi Âm Thanh
Chuyển đổi âm thanh bằng mô hình giọng nói đã được huấn luyện
Mã nhận dạng giọng nói đối với mô hình đa giọng nói
Nhập đường dẫn đến tệp âm thanh
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Sự kết hợp của hai hoặc nhiều loại trích xuất khác nhau
Hòa trộn các tầng của mô hình nhúng lại với nhau nhằm mục đích cải thiện chất lượng âm thanh.
Âm thanh đã được chuyển đổi
Chuyển Đổi Âm Thanh Với Bộ Phát Hiện Giọng Nói
Sử dụng bộ phát hiện giọng nói (Voice Activity Detection) kết hợp với mô hình SpeechBrain để tự động nhận diện các giọng nói trong tệp âm thanh. Sau đó, tiến hành cắt và chia nhỏ âm thanh thành từng đoạn riêng biệt sau đó sẽ áp dụng chuyển đổi bằng mô hình giọng nói.
Mã nhận dạng giọng nói đối với mô hình đa giọng nói
Nhập đường dẫn đến tệp âm thanh
Mã nhận dạng giọng nói đối với mô hình đa giọng nói
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Sự kết hợp của hai hoặc nhiều loại trích xuất khác nhau
Hòa trộn các tầng của mô hình nhúng lại với nhau nhằm mục đích cải thiện chất lượng âm thanh.
Đầu vào, đầu ra âm thanh
Chuyển Đổi Văn Bản Thành Giọng Nói
Chuyển văn bản thành giọng nói và đọc lại bằng mô hình giọng nói được huấn luyện
Mã nhận dạng giọng nói đối với mô hình đa giọng nói
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Sự kết hợp của hai hoặc nhiều loại trích xuất khác nhau
Hòa trộn các tầng của mô hình nhúng lại với nhau nhằm mục đích cải thiện chất lượng âm thanh.
Âm thanh chưa được chuyển đổi và âm thanh đã được chuyển đổi
Áp Dụng Thêm Hiệu Ứng Cho Âm Thanh
Chỉnh sửa thêm hiệu ứng cho âm thanh
Nhập đường dẫn đến tệp âm thanh
Nhập đường dẫn đến tệp âm thanh
Tạo hiệu ứng vang liên tục khi bật chế độ này
Đầu ra âm thanh
Những Hiệu Ứng Kỳ Quặc Dành Cho Âm Thanh
Áp dụng những hiệu ứng kỳ quặc cho âm thanh của bạn để chúng chở nên kỳ quặc dị dạng.
Nhập đường dẫn đến tệp âm thanh
Chuyển Đổi Thời Gian Thực
Chuyển đổi giọng nói theo thời gian thực
Chưa bắt đầu thời gian thực
Thiết bị âm thanh đầu vào, Khuyên dùng WASAPI hoặc ASIO vì độ trễ thấp
Thiết bị âm thanh đầu ra, thiết bị phát âm thanh đầu ra ví dụ: Loa, tai nghe,...
Thiết bị âm thanh đầu ra thứ hai dùng để nghe lại âm thanh
Mã nhận dạng giọng nói đối với mô hình đa giọng nói
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Hòa trộn các tầng của mô hình nhúng lại với nhau nhằm mục đích cải thiện chất lượng âm thanh.
Tạo hiệu ứng vang liên tục khi bật chế độ này
Huấn Luyện Mô Hình
Huấn luyện và đào tạo mô hình giọng nói bằng một lượng dữ liệu giọng nói
Tên được đặt cho bộ tham chiếu đầu ra dùng để kiểm tra mô hình
Sự kết hợp của hai hoặc nhiều loại trích xuất khác nhau
Hòa trộn các tầng của mô hình nhúng lại với nhau nhằm mục đích cải thiện chất lượng âm thanh.
Lưu mô hình vào bộ nhớ đệm gpu
Huấn luyện mô hình với năng lượng RMS
Kiểm tra huấn luyện mô hình quá sức
Tùy chọn thư mục dữ liệu huấn luyện
Chỉ lưu mô hình D và G mới nhất
Lưu mọi mô hình sau mỗi lượt kỷ nguyên
Dọn dẹp và huấn luyện lại từ đầu
Không dùng huấn luyện trước
Tùy chỉnh huấn luyện trước
So sánh phổ Mel của âm thanh thật và âm thanh giả ở nhiều thang độ khác nhau. Giúp mô hình học được chi tiết âm sắc, độ sáng và cấu trúc tần số tốt hơn, từ đó cải thiện chất lượng và độ tự nhiên của giọng nói đầu ra.
Bắt buộc sử dụng phương pháp giảm LR bằng Cosine Annealing có thể giúp cải thiện chất lượng phát âm.
Khi bật sẽ sử dụng các thuật toán có tính xác định cao, đảm bảo rằng mỗi lần chạy cùng một dữ liệu đầu vào sẽ cho kết quả giống nhau.
Khi tắt có thể chọn các thuật toán tối ưu hơn nhưng có thể không hoàn toàn xác định, dẫn đến kết quả huấn luyện có sự khác biệt giữa các lần chạy.
Khi bật sẽ thử nghiệm và chọn thuật toán tối ưu nhất cho phần cứng và kích thước cụ thể. Điều này có thể giúp tăng tốc độ huấn luyện.
Khi tắt sẽ không thực hiện tối ưu thuật toán này, có thể làm giảm tốc độ nhưng đảm bảo rằng mỗi lần chạy sử dụng cùng một thuật toán, điều này hữu ích nếu bạn muốn tái tạo chính xác.
Tạo Dữ Liệu Huấn Luyện Từ Youtube
Xử lí và tạo tập tin dữ liệu huấn luyện bằng đường dẫn youtube
Tạo Dữ Liệu Tham Chiếu Huấn Luyện
Tạo một tập dữ liệu tham chiếu nhỏ dùng để kiểm tra huấn luyện mô hình thông qua tensorboard
Nhập đường dẫn đến tệp âm thanh
Sự kết hợp của hai hoặc nhiều loại trích xuất khác nhau
Hòa trộn các tầng của mô hình nhúng lại với nhau nhằm mục đích cải thiện chất lượng âm thanh.
Tải Xuống Mô Hình
Tải xuống mô hình giọng nói, mô hình huấn luyện trước
Chọn mô hình huấn luyện trước để cài đặt về
Tốc độ lấy mẫu của mô hình
Dung Hợp Hai Mô Hình Với Nhau
Dung hợp hai mô hình giọng nói lại với nhau để tạo thành một mô hình duy nhất
Đọc Thông Tin Của Mô Hình
Đọc các thông tin được ghi trong mô hình
Chuyển Đổi Mô Hình PYTORCH Sang ONNX
Chuyển đổi mô hình RVC từ dạng pytorch sang onnx để tối ưu cho việc chuyển đổi âm thanh
Chuyển đổi mô hình SVC sang định dạng dự án có thể đọc
Chuyển đổi các mô hình SVC được huấn luyện từ Sovits SVC 4.1 thành định dạng mà dự án có thể đọc được. Hiện tại chỉ hỗ trợ mô hình với cấu hình gốc.
Trích Xuất Cao Độ
Trích xuất cao độ F0 nhằm mục đích sử dụng cho suy luận chuyển đổi âm thanh
Tạo Tệp SRT Từ Tệp Âm Thanh
Sử dụng Whisper để chuyển đổi tệp âm thanh sang văn bản và tạo tệp srt
Đặt ngôn ngữ đầu vào để tránh mô hình xác nhận ngôn ngữ sai
Nhập đường dẫn đến tệp âm thanh
Tùy Chỉnh Thêm
Tùy chỉnh thêm một số tính năng của dự án
Ngôn ngữ được hiển thị trong dự án (Khi thay đổi cần khởi động lại hệ thống để áp dụng)
Loại Chủ đề của giao diện được hiển thị (Khi thay đổi cần khởi động lại hệ thống để áp dụng)
Bấm vào đây nếu bạn muốn bị Rick Roll:) ---> RickRoll
Vui lòng không sử dụng Dự án với bất kỳ mục đích nào vi phạm đạo đức, pháp luật, hoặc gây tổn hại đến cá nhân, tổ chức...
Trong trường hợp người sử dụng không tuân thủ các điều khoản hoặc vi phạm, tôi sẽ không chịu trách nhiệm về bất kỳ khiếu nại, thiệt hại, hay trách nhiệm pháp lý nào, dù là trong hợp đồng, do sơ suất, hay các lý do khác, phát sinh từ, ngoài, hoặc liên quan đến phần mềm, việc sử dụng phần mềm hoặc các giao dịch khác liên quan đến phần mềm.