🎵VIETNAMESE RVC BY ANH🎵
Công cụ huấn luyện, chuyển đổi nhạc cụ và giọng nói chất lượng và hiệu suất cao đơn giản dành cho người Việt
Tách Nhạc
Một hệ thống tách nhạc đơn giản có thể tách được 4 phần: Nhạc, giọng, giọng chính, giọng bè
Âm thanh đã được tách
Chuyển Đổi Âm Thanh
Chuyển đổi âm thanh bằng mô hình giọng nói đã được huấn luyện
Nhập đường dẫn đến tệp âm thanh
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Âm thanh đã được chuyển đổi
Chuyển Đổi Âm Thanh Với Whisper
Chuyển đổi âm thanh bằng mô hình giọng nói đã được huấn luyện kèm với mô hình Whisper để nhận diện giọng nói
Whisper sẽ nhận dạng các giọng nói khác nhau sau đó cắt các giọng riêng ra rồi dùng mô hình RVC để chuyển đổi lại các phân đoạn đó
Mô hình Whisper có thể hoạt động không chính xác làm cho đầu ra có thể kì lạ
Nhập đường dẫn đến tệp âm thanh
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Đầu vào, đầu ra âm thanh
Chuyển Đổi Văn Bản Thành Giọng Nói
Chuyển văn bản thành giọng nói và đọc lại bằng mô hình giọng nói được huấn luyện
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Âm thanh chưa được chuyển đổi và âm thanh đã được chuyển đổi
Áp Dụng Thêm Hiệu Ứng Cho Âm Thanh
Chỉnh sửa thêm hiệu ứng cho âm thanh
Nhập đường dẫn đến tệp âm thanh
Đầu ra âm thanh
Những Hiệu Ứng Kỳ Quặc Dành Cho Âm Thanh
Áp dụng những hiệu ứng kỳ quặc cho âm thanh của bạn để chúng chở nên kỳ quặc dị dạng.
Nhập đường dẫn đến tệp âm thanh
Chuyển Đổi Thời Gian Thực
Chuyển đổi giọng nói theo thời gian thực
Thiết bị âm thanh đầu vào, Khuyên dùng WASAPI hoặc ASIO vì độ trễ thấp
Thiết bị âm thanh đầu ra, thiết bị phát âm thanh đầu ra ví dụ: Loa, tai nghe,...
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Tạo Dữ Liệu Huấn Luyện Từ Youtube
Xử lí và tạo tập tin dữ liệu huấn luyện bằng đường dẫn youtube
Tạo Dữ Liệu Tham Chiếu Huấn Luyện
Tạo một tập dữ liệu tham chiếu nhỏ dùng để kiểm tra huấn luyện mô hình thông qua tensorboard
Nhập đường dẫn đến tệp âm thanh
Huấn Luyện Mô Hình
Huấn luyện và đào tạo mô hình giọng nói bằng một lượng dữ liệu giọng nói
Lưu mô hình vào bộ nhớ đệm gpu
Huấn luyện mô hình với năng lượng RMS
Kiểm tra huấn luyện mô hình quá sức
Tùy chọn thư mục dữ liệu huấn luyện
Chỉ lưu mô hình D và G mới nhất
Lưu mọi mô hình sau mỗi lượt kỷ nguyên
Dọn dẹp và huấn luyện lại từ đầu
Không dùng huấn luyện trước
Tùy chỉnh huấn luyện trước
So sánh phổ Mel của âm thanh thật và âm thanh giả ở nhiều thang độ khác nhau. Giúp mô hình học được chi tiết âm sắc, độ sáng và cấu trúc tần số tốt hơn, từ đó cải thiện chất lượng và độ tự nhiên của giọng nói đầu ra.
Khi bật sẽ sử dụng các thuật toán có tính xác định cao, đảm bảo rằng mỗi lần chạy cùng một dữ liệu đầu vào sẽ cho kết quả giống nhau.
Khi tắt có thể chọn các thuật toán tối ưu hơn nhưng có thể không hoàn toàn xác định, dẫn đến kết quả huấn luyện có sự khác biệt giữa các lần chạy.
Khi bật sẽ thử nghiệm và chọn thuật toán tối ưu nhất cho phần cứng và kích thước cụ thể. Điều này có thể giúp tăng tốc độ huấn luyện.
Khi tắt sẽ không thực hiện tối ưu thuật toán này, có thể làm giảm tốc độ nhưng đảm bảo rằng mỗi lần chạy sử dụng cùng một thuật toán, điều này hữu ích nếu bạn muốn tái tạo chính xác.
Tải Xuống Mô Hình
Tải xuống mô hình giọng nói, mô hình huấn luyện trước, mô hình nhúng
Dung Hợp Hai Mô Hình Với Nhau
Dung hợp hai mô hình giọng nói lại với nhau để tạo thành một mô hình duy nhất
Đọc Thông Tin Của Mô Hình
Đọc các thông tin được ghi trong mô hình
Chuyển Đổi Mô Hình PYTORCH Sang ONNX
Chuyển đổi mô hình RVC từ dạng pytorch sang onnx để tối ưu cho việc chuyển đổi âm thanh
Trích Xuất Cao Độ
Trích xuất cao độ F0 nhằm mục đích sử dụng cho suy luận chuyển đổi âm thanh
Trích xuất cao độ bằng mô hình ONNX có thể giúp tăng tốc độ
Mở khóa toàn bộ phương pháp trích xuất cao độ
Tạo Tệp SRT Từ Tệp Âm Thanh
Sử dụng Whisper để chuyển đổi tệp âm thanh sang văn bản và tạo tệp srt
Cung cấp thời gian bắt đầu và kết thúc của từng từ trong tệp âm thanh được chuyển thành văn bản.
Nhập đường dẫn đến tệp âm thanh
Tùy Chỉnh Thêm
Tùy chỉnh thêm một số tính năng của dự án
Ngôn ngữ được hiển thị trong dự án(Khi đổi ngôn ngữ hệ thống sẽ tự khởi động lại sau 30 giây để cập nhật)
Loại Chủ đề của giao diện được hiển thị(Khi đổi chủ đề hệ thống sẽ tự khởi động lại sau 30 giây để cập nhật)
Bấm vào đây nếu bạn muốn bị Rick Roll:) ---> RickRoll
Vui lòng không sử dụng Dự án với bất kỳ mục đích nào vi phạm đạo đức, pháp luật, hoặc gây tổn hại đến cá nhân, tổ chức...
Trong trường hợp người sử dụng không tuân thủ các điều khoản hoặc vi phạm, tôi sẽ không chịu trách nhiệm về bất kỳ khiếu nại, thiệt hại, hay trách nhiệm pháp lý nào, dù là trong hợp đồng, do sơ suất, hay các lý do khác, phát sinh từ, ngoài, hoặc liên quan đến phần mềm, việc sử dụng phần mềm hoặc các giao dịch khác liên quan đến phần mềm.