文語通是一款非常專業(yè)的真人發(fā)音語音朗讀軟件,能夠輕松的將常見的文檔格式如Doc、TXT及Html等)配上真人語音庫后能順暢自然、清晰的朗讀出來,并且不會(huì)死板和生硬!
文語通簡介
文語通是一款國內(nèi)自主研發(fā)的文檔閱讀軟件,支持我們經(jīng)常使用的文檔格式,比如doc、txt及html等等,可以用高清的語音進(jìn)行朗讀出來,它采用的引擎非常的好,讀出來的聲音讓人聽起來非常的舒服,而且比別的朗讀軟件相比更自然!它朗讀中文文章感覺很好,英文的單詞發(fā)音非常棒?。。ㄖ皇侨绻怯⑽奈恼吕首x起來就不是很自然了,因?yàn)樗且粋€(gè)單詞一個(gè)單詞朗讀的)這款軟件幫助您學(xué)習(xí)英語,讀英文單詞要比“金山詞霸”好得多!
文語通軟件特色
1、方便靈活的應(yīng)用架構(gòu)
基于tcp/ip的高效網(wǎng)絡(luò)語音合成服務(wù)和集中式的資源管理機(jī)制,形成客戶端-資源管理器-服務(wù)器有機(jī)結(jié)合
2、支持開放式標(biāo)準(zhǔn)
全面支持中文語音合成系統(tǒng)通用技術(shù)標(biāo)準(zhǔn)(gb/t21024-2007),遵循標(biāo)準(zhǔn)規(guī)定的術(shù)語定義、分類標(biāo)準(zhǔn)、數(shù)據(jù)交換格式標(biāo)準(zhǔn)和應(yīng)用規(guī)范。
3、背景音樂,快捷提升用戶體檢
interphonic提供業(yè)界首創(chuàng)的背景音功能,通過系統(tǒng)提供的簡單易用工具,可以便捷高效的添加背景音樂,調(diào)整背景音樂和合成語音的音量對比,并可直接試聽實(shí)際效果,使語音服務(wù)更加親切自然。
4、字符集、語音數(shù)據(jù)格式支持
全面支持gb2312、gbk、big5、gb18030、utf-8和unicode編碼字符集,自動(dòng)識別unicode文本;支持直接輸出多種采樣率的語音數(shù)據(jù)格式(包括6k/8k/11k/16k)的線性wav、a/u率wav和vox等多種格式的語音數(shù)據(jù)。
5、靈活高效的開發(fā)接口
interphonic sdk針對不同開發(fā)工具,不同集成要求和方案,提供多種形式的開發(fā)接口,包括:標(biāo)準(zhǔn)開發(fā)接口(dll)、com組件、sapi開發(fā)接口等,開發(fā)者可以根據(jù)實(shí)際需要靈活選擇。提供豐富的開發(fā)例程和文檔,幫助合作伙伴加速語音應(yīng)用開發(fā)過程。
6、預(yù)錄語音,銜接流暢應(yīng)用簡便
interphonic提供業(yè)界創(chuàng)新的預(yù)錄音統(tǒng)一管理功能,將預(yù)錄音作為語音合成系統(tǒng)的資源,并通過提示音智能匹配和合成模板等方式使預(yù)錄音與合成 音匹配更加容易、銜接更加流暢,同時(shí)避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應(yīng)用流程的復(fù)雜程度,進(jìn)一步提高服務(wù)效果與質(zhì)量。
7、高效便捷的增強(qiáng)工具集
科大訊飛在長期幫助客戶進(jìn)行應(yīng)用開發(fā)和效果優(yōu)化的過程中,積累了豐富的實(shí)踐經(jīng)驗(yàn),在此基礎(chǔ)上逐步形成了一系列使用便捷的高效組件,如離線語音應(yīng)用工 具、cssml可視化編輯工具、doc/xls文本格式轉(zhuǎn)換工具等。靈活運(yùn)用這些工具有助于加速應(yīng)用開發(fā),優(yōu)化合成效果、方便系統(tǒng)維護(hù)和技術(shù)支持。
8、廣泛的平臺(tái)支持
支持主流的操作系統(tǒng),服務(wù)器端支持windows、unix、linux等操作系統(tǒng),客戶端支持microsoft windows、sun solaris、redhat linux、suse linux等操作系統(tǒng)。與業(yè)內(nèi)知名的相關(guān)平臺(tái)和設(shè)備商均有過成功的集成案例。通過與眾多平臺(tái)和設(shè)備提供商、系統(tǒng)集成商及軟件開發(fā)商的緊密合作,能夠保證向用戶提供圍繞語音應(yīng)用全程的專業(yè)服務(wù)。
9、cssml,效果提升更自如
cssml(chinese speech synthesis markup language)是由科大訊飛提出并牽頭制訂的中文語音數(shù)據(jù)描述規(guī)范。該標(biāo)準(zhǔn)得到了國家863專家組、國家信標(biāo)委和國家技術(shù)監(jiān)督局的大力關(guān)注與支 持,2005年正式通過國家標(biāo)準(zhǔn)化組織的評審,成為中文語音合成技術(shù)標(biāo)準(zhǔn)與規(guī)范的重要內(nèi)容。cssml針對中文語音應(yīng)用設(shè)計(jì)和擴(kuò)展,可以對多種特性進(jìn)行靈 活標(biāo)注與控制,并與ssml兼容。
10、文語通軟件安裝向?qū)?/strong>
體系架構(gòu),構(gòu)建可靈活伸縮的方案,其高可用性歷經(jīng)眾多重點(diǎn)行業(yè)大規(guī)模關(guān)鍵業(yè)務(wù)的應(yīng)用檢驗(yàn),確保提供值得信賴的7×24小時(shí)不間斷自動(dòng)化語音服務(wù)。 并支持分布式應(yīng)用架構(gòu)(專利技術(shù)),負(fù)責(zé)文本分析和預(yù)處理的前端與負(fù)責(zé)語音合成的后端可以分別部署在異地服務(wù)器上,遠(yuǎn)程網(wǎng)絡(luò)之間傳輸?shù)闹皇墙?jīng)分析標(biāo)注的文 本信息,從而極大降低語音應(yīng)用的網(wǎng)絡(luò)帶寬要求,非常適合基于互聯(lián)網(wǎng)的大規(guī)模分布式語音應(yīng)用。
11、豐富的參數(shù)設(shè)置與靈活調(diào)整功能
提供豐富完善的動(dòng)態(tài)參數(shù)設(shè)置與調(diào)節(jié)功能和工具,幫助用戶對語音合成效果進(jìn)行靈活高效的控制與管理。提供對全局參數(shù)(如音量、語速、音高等)、用戶詞 典、用戶規(guī)則、定制資源包統(tǒng)一進(jìn)行配置和管理的工具;數(shù)字、標(biāo)點(diǎn)符號、英文發(fā)音方式的設(shè)定;中英文加詞功能,可以指定每個(gè)字詞的拼音或音標(biāo)等等;提供統(tǒng)一 的簡單易用圖形化用戶界面進(jìn)行操作設(shè)定,并可通過api參數(shù)進(jìn)行動(dòng)態(tài)設(shè)置和調(diào)整,還支持以cssml(中文語音合成標(biāo)記語言)進(jìn)行標(biāo)記、描述和控制。
支持語音合成標(biāo)記語言(ssml:speech synthesis markup language),它是w3c的語音接口框架的一部分,是關(guān)于語音應(yīng)用和在萬維網(wǎng)上構(gòu)建語音應(yīng)用的一套規(guī)范,通過ssml,人們可以更多的通過移動(dòng)電 話、桌面計(jì)算機(jī)和其他設(shè)備來聆聽合成語音,把計(jì)算和信息傳輸延伸到全球每個(gè)角落。
支持媒體資源控制協(xié)議(mrcp:media resource control protocol),它由ietf發(fā)布,定義了媒體服務(wù)器和網(wǎng)絡(luò)語音資源(包括語音識別和語音合成服務(wù)器)之間的接口標(biāo)準(zhǔn)。
文語通軟件功能
1.程序運(yùn)行就自動(dòng)初始化并加載服務(wù)
2.批量生成同名的wav文件后如有需要請大家用別的音頻轉(zhuǎn)換程序轉(zhuǎn)成自己所需要的如mp3等模式
3.合成過程中時(shí)間等狀態(tài)實(shí)時(shí)顯示,可實(shí)現(xiàn)一邊合成一邊朗讀的“實(shí)時(shí)預(yù)覽模式”(如只要求生成wav文件則請選擇“主線程調(diào)用方式”)
4.可以通過瀏覽文件批量添加.txt文本文件,內(nèi)碼支持gb2312gbkbig5utf8,(注意單個(gè).txt文本要求小于64k,這是合成系統(tǒng)程序本身的限制,考慮到語言的連貫性問題,編程時(shí)并沒有采用自動(dòng)分割大txt文件的方法,需要大家手動(dòng)分割txt文件小于64kb)
使用教程
1、打開文語通,輸入文本內(nèi)容,并選擇音庫
2、全選內(nèi)容,點(diǎn)擊如圖按鈕生成音頻文件
3、為音頻命名,并保存至你想要的位置
4、將音頻轉(zhuǎn)成mp3格式。打開audition軟件,將音頻拖拽進(jìn)來,出現(xiàn)音軌。
5、加速音頻,修改比率,進(jìn)行變速。200表示2倍速,300表示3倍速,以此類推
6、另存為mp3格式