Ngày 22 tháng 1, GLM-4-Voice, mô hình âm thanh đầu cuối đầu tiên của Zhipu AI, đã chính thức được ra mắt trên nền tảng mở. Nó có thể trực tiếp hiểu và tạo ra giọng nói tiếng Trung và tiếng Anh, thực hiện cuộc trò chuyện giọng nói thời gian thực và có thể linh hoạt điều chỉnh các đặc tính của giọng nói như cảm xúc, giọng điệu, tốc độ và ngôn ngữ phương ngữ dựa trên các chỉ thị của người dùng, tạo ra sự tương tác giọng nói tự nhiên hơn và sống động hơn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
智谱BigModel đầu tiên API âm thanh từ đầu đến cuối mới
Ngày 22 tháng 1, GLM-4-Voice, mô hình âm thanh đầu cuối đầu tiên của Zhipu AI, đã chính thức được ra mắt trên nền tảng mở. Nó có thể trực tiếp hiểu và tạo ra giọng nói tiếng Trung và tiếng Anh, thực hiện cuộc trò chuyện giọng nói thời gian thực và có thể linh hoạt điều chỉnh các đặc tính của giọng nói như cảm xúc, giọng điệu, tốc độ và ngôn ngữ phương ngữ dựa trên các chỉ thị của người dùng, tạo ra sự tương tác giọng nói tự nhiên hơn và sống động hơn.