初音ミク的可能性

| |
不指定 2007/10/01 09:01 [聲優]



初音ミク的可能性

少女偶像萌聲軟件「初音ミク」自831日發售以來(引擎「VOCALOID」由Yamaha開發,現售15750),一直供不應求,有緣使用者多樂此不疲,每天一曲已成不少「初音ミク作曲填詞家」的習慣。還未入手者,在「ニコニコ動画」(連Youtubemixi也熱起來)觀看及評論,亦一樂也。一些「初音ミク達人」的「神作」引起話題,例如みくみくにしてあげる」在「ニコニコ動画」短短一週被下載超過50萬次此外,原作CM songPackaged」兩天便被下載逾十萬次。現在有商人正計劃將這些「神作」出CD與同人誌相似,除創作系外,還有parodymadParody是用「初音ミク」唱現存歌曲;Mad是指重編現存歌曲,還有人給歌曲配上動畫



「初音ミク」的潛質無限,現在這軟件還有很大的改善空間,例如只有聲優優藤田咲一把女聲,而且唱起來有時頗機械,
將來相信會改善。現在以萌系動畫愛好者為目標,牛刀小試便有如此成績,此技術若能進一步大眾化及全球化,說不定會是繼karaoke後的另一影響全人類的make in Japan娛樂技術。


想想若有一天推出港版,可以選陳百強、黄家駒、梅艷芳、羅文及張國榮唱我們作的歌,這是多麼奇妙的事。
Posted by 知日部屋屋主 | 評論(43) | 引用(0) | 閱讀(27519)
99love11 +
2019/12/04 20:18
美国黑金         印度神藥          日本藤素          2H2D         必利勁
99love11 +
2019/12/04 20:18
美国黑金         印度神藥          日本藤素          2H2D         必利勁
twsex99 +
2019/11/27 21:14
持久液        壯陽藥     日本藤素       補腎     必利吉
広州仔在日本 Homepage +
2008/01/27 13:33
之前看过金田一春彦的《日本语》,他就从日语的音节构成简单这个特点出发,预测最早将虚拟发声实用化的,非日本人莫属。今天果然成为现实,而且还是萌声grin
(AM-3P) +
2007/11/27 01:00
向中国发售没什可能....或者只售给TW和HK
Cl Homepage +
2007/11/10 14:08
下一集鏡音リン公佈了
聲優為在[email protected]中飾演雙海亞美,真美的下田麻美。網上面已經有鏡音的Mad(多數剪[email protected]的聲帶)。
說起上來如果[email protected]跟Vocaloid2混合的話製Mad一定非常好玩…
Aiko Sunoo +
2007/11/10 00:16
> 做Voice Synthesis軟件需要很深厚的數學根底,而且是相當難、需要再加深研究的範籌。AL程度的Phy、Math都相對地太淺了,講就容易做就難。而MS Speech SDK則是功能欠缺以及做出來的效果太差,現在己經很少人會採用了。

Don\\\\\\\'t think that You can understand all wave theories written from reading a HKAL Physics syllabuse ALONE: the principle behinds are all simplfied and there are many conditions omitted. In order to perform voice synthesis, you have to understand the principle of regression analysis in MASTER LEVEL of mathematics. (they are not difficult to read, so long as you have a WILL and your English, especially on prepositions, is not too bad) This requires prolific understanding of calculus (higher derivatives) and vector space from OLD (pre-2006) syllabuse of Pure Math. Once you understand this, you will find that HKAL Physics has never dissected daily-life acoustic patterns such as vocals and melody arrangements. But by applying the principles of regession analysis you can parse and separate the source wave functions from a summated amplitude of resultant wave. (of course, you have to know where the waves vibrate from in various directions). That is the prerequisite of identifying various properties of a sound.

A trick: Although Sun Java programmes cannot make sound without Win32 APIs, you can still resolve a resultant wave into source waves using simple loops for pure music. Once you bulid up the classes for a specific set of musical instruments, you can use Regular Expression to parse the wave files (wav only, NOT mp3/wma!). As to the methods, please consult experienced lecturers who know Internet and Communication Technology OR Multimedia and Information Technology, from either IVE, Open U or HKUST.
黑桐 Homepage +
2007/11/09 17:55
做Voice Synthesis軟件需要很深厚的數學根底,而且是相當難、需要再加深研究的範籌。AL程度的Phy、Math都相對地太淺了,講就容易做就難。而MS Speech SDK則是功能欠缺以及做出來的效果太差,現在己經很少人會採用了。
Aiko Sunoo +
2007/11/09 02:11
> 玩 DelayLama 吧

Foul langauge?

Don't kid me!

Microsoft have developed a Speech Engine SDK so that you can make your own sound pattern for free.

Prerequisites:

You must know the interference mechanism well as well as advanced c++ programming skills.
Aiko Sunoo +
2007/11/09 02:09
Full name:
VOCALOID2 初音ミク -HATSUNE MIKU

Alternative Vocaloid engine:

1. Yamaha Vocaloid LEON
2. Yamaha Vocaloid Miriam
3. Yamaha.Vocaloid.LOLA

If you have studied HKAL Physics you can surely change the overtone of the vocal frequency so that you can produce your own voice pattern.
黑桐 Homepage +
2007/11/02 18:27
看了初音ミク的介紹,這個發聲軟件好像很好玩的樣子。編製真人自然發聲軟件真的頗有難度,每個軟件商都有各自的一套方法。但基本上都離不開精準的錄音取樣本,再加一堆傅立葉變換的算式將人聲轉換成一大列簡化的波形組合,然後才根據設定重組、合成新的波形變化(這個部份最難)。而且並不是每個人的聲線都適合拿來取樣、合成的,高音部份比低音部份容易取樣、合成,所以壓尖聲線的女高音會合成得比較自然,而低沉的男聲會合成得比較機械化、混濁含糊一些。其實,與其用音標輸入的方法不如直接讓使用者發音再通過軟件變聲,合成的效果可能會好一些。
YON +
2007/10/11 10:34
中华人民共和国国歌初音版
http://www.youtube.com/watch?v=w2hhAvDQZcI
知日部屋屋主 回覆於 2007/10/11 10:36
神作
KC +
2007/10/05 05:49
提提大家..
Vocaloid 2 是有英文版的
叫 sweet ana
自己找找吧
nyx +
2007/10/03 00:51
其實未有初音ミク前, 第一代的 Vocaloid "Meiko" 已有神人級數的創作人, 例如 ワンカップP. 不過他也是因為那個 "初音ミクが来ない?来た?" 事件最為人津津樂道:

ttp://www.nicovideo.jp/watch/sm1051497

BTW, 有錢的可以玩 初音ミク, 沒錢的... 玩 DelayLama 吧, 畢竟也很歡樂. (笑)

ttp://www.nicovideo.jp/watch/sm374734
托 +
2007/10/02 20:52
>Titan

連同複韻母,粵語有56個韻,連同零聲母,則計有20個音節。
Titan +
2007/10/02 19:12
這裡不少人分不清母音、子音和聲調的分別

香港話有多少個母音和子音我沒數過,大概與其他語言不差太遠,不過聲調有九個,這放諸全球也數是多數

變聲會改變意思,這是很多東南亞語言的特點。

日語的母音、子音加起的組合才五十個,而且聲調幾乎無關字意(在很少很少情況下有關),在全球比較也算是簡單到幾乎極點。大概也因如此,日語同音異義的例子多不勝數,有些人大概會因而覺得日語易寫易讀難聽難說(例如小弟就是一個)
VIKK33 +
2007/10/02 18:18
http://www.nicovideo.jp/watch/sm1090763 ←這是閩南話?
這是閩南語(台語)沒錯
這首歌是台灣膾炙人口的"墓仔埔也敢去"(普通話:墳場也敢去)
在台灣常可聽到
台語同日語
保留大量古代漢語發音
所以初音ミク要唱不是不可能
我很高興他會唱台語
Eky +
2007/10/02 03:19
(提醒一下屋主,「初音ミク」不是Yamaha開發的,而是CRYPTON FUTURE MEDIA。Yamaha開發的是初音ミク的引擎「VOCALOID」。)

其實ミク已經可以做到「說話」,只是比較困難,而且機械性明顯,可以看看某ave;new的示範:http://blog.avenew.jp/archives/80(稍下方)。也可以做到普通話4聲或廣東話9聲,但當然比日文更難,而且製作人要非常熟悉當中的PIT(Pitch Bend)和PBS(Pitch Bend Sensitivity)參數。
至於背後原理,CRYPTON只說了這些:「日本語の全ての音声パターン(母音/子音)と、母音から子音のつながりを録音するため、呪文のような歌を、複数の音の高さのパターンで録音しました。その後、録音された音声データを分解し、Vocaloid 2 ライブラリ制作用の開発ツールに流し込んで作り込みました。」(http://seiyunews.com/modules/news/article.php?stor...

其實之前已經有幾個同引擎的軟件,只是沒有像ミク這樣發揚光大起來而已。(見http://zh.wikipedia.org/wiki/VOCALOID

http://www.nicovideo.jp/watch/sm1090763 ←這是閩南話?
小狼 Homepage +
2007/10/02 00:45
piku君弄了廣東話版的,是用日文拼出來的~
http://www.cuhkacs.org/~piku/blog/read.php?210
如果初音出粵語版,絕對是一件好事啊!
知日部屋屋主 回覆於 2007/10/02 07:17
像閩南話?
xelein +
2007/10/02 00:21
一個系列成功,不只是一個軟件,一把人聲。
miku包含的還有許多人努力作曲和投予感情。

不單是看和聽,同樣是創作的人,是acg的成功之處。
coolsmilecoolsmile
托 +
2007/10/01 22:37
其實人造聲音早就不是新聞,不過做出易用到這個地步真不容易...(對日本人,有聲學底子和電子音樂制作能力來說...網上此類職人不少...)

曾試用過這一軟件,由於是用日語發音為主,所以要完成其他語言的歌曲較難(各種語言的音素構成有差別,聲調法則也各不同,簡單舉例,日語之韻母AIUEO跟普通話之韻母AEIOU分別很大,以U為甚,音韻學上是完全兩回事。)。

如果Yamaha會將此打進國際市場,應會推出以國際音標為本的版本(國際音標可以涵蓋各語言,不過相對來說較難),只是會令製作變得困難(同樣是a,普通話中就分別對了數個不同的國際音標...),普及程度可能不及現在日文版的盛況。
小櫻的kero +
2007/10/01 20:15
to 屋主
剛剛在nico上找過,有的確是有............只是超脫力啊!而且數量不多。
強烈要求增加「水木兄貴version」!
小櫻的kero +
2007/10/01 19:52
突然想到一樣東西︰
如果把mazinger z、getter、gaogaigor、srw等熱血robot歌曲輸進去會有怎樣的效果???grin
知日部屋屋主 回覆於 2007/10/01 19:54
萌不起來
亂up24 +
2007/10/01 18:28
廣東話的怕是比較難了, 看看現在單是那些發音字典類的軟體也怪怪的. 而且廣東話歌很多時都是那種"鵝悶是快樂的好耳痛"的怪調, 用讀的發出來的聲相信會很突兀.
再說, 就市場而言, 相信有普通話也輪不到廣東話版本. cry
影翠 +
2007/10/01 18:11
>>shadowzo
你指的應是Formant synthesis
他們不用人聲,直接利用電腦內部的data發聲
text-to-speech絕不可能做到初音的水準(以歌來進行其實是最容易的= =,真的要電腦自行來一次演說還要很久.)

想一想,我們說普通話時有四聲,廣東話有九音,還有輕重聲,高低音,不同的重音位置,要電腦明白他們是十分麻煩的.
但有了歌曲,上面的東西便不用一次次的考慮.歌詞中的輕重音已是被limit了,人人唱的都是要按樂譜唱,必要做的programming少了,自然可以發出更自然的聲音.

還望電腦和語言學的強者補完m(_ _)m

ps:我也想買初音@口@
想將她分解學習(呼呼呼
拆掉她的programme
錢包先生,你要努力啊^^

pps:那公司說會用新人聲優
so,
二,三回作,加藤英美里and福原香織希望XD
鏡大人X小司希望XDDD
天河明人 +
2007/10/01 17:35
>>shadowzo

Text to Speech 只是純粹播錄音...
shadowzo Homepage +
2007/10/01 17:25
To 影翠

對這個軟件很有興趣,所以想請教一下,他的做法,不是跟流行了很久的text-to-speech軟件原理差不多嗎?但,用那種做法,聲音會很平板...
影翠 +
2007/10/01 16:17
指正可不敢
我還是新手,不過有一點資料可用來求證

由於主公司沒有公開資料,所以不能完全肯定初音所有的方法,不過他應用了Diphone synthesis而非現時常用的
Unit selection synthesis.Diphone是錄取音與音間的轉換,而unit selection是錄取詞語本身.由於初音要求我們打入歌詞和歌曲<---作為初音的音調和音域指南,加上初音只要512mb-2GB的容量(Unit selection的database已至少以GB計算),而且Unit selection的製作方法很難廉價出售,所以我們可估計crypton公司是以diphone synthesis完成初音的.這樣,藤田小姐只要錄取日本語全部的Phonotactics便可以了.(大約一千個,總較錄取全部詞語好= =)
不過,diphone所合成出的聲音是較unit selection的為差.但這次卻是完全相反.因此應是由於yamaha開發的新程式(Frequency-domain Singing Articulation Splicing and Shaping)所造成的.這個程式現在沒有公開發售,所以也無從研究他的方法
Commander +
2007/10/01 14:55
TO koshiro666
我反而認為不會真的發生這樣的事
因為這是音樂創作工具
要是唱片公司反對,要打成禁賣品的話
這是侵犯創作自由
違反基本法,這個罪名,唱片公司受不起

PS:當然唱片公司的智慧有多高,大家心中有數,我想唱片公司頂多罵下便算(或者不出聲,因為一罵便是幫手宣傳
gringrin )
馮友 Homepage +
2007/10/01 14:55
如果真是要「唱」必需把聲線扯變,所以要有一定程度的「走音」

其實現在聽來軟件也十分成熟,只是某些位置仍唱得不夠圓。不知何解聲音滿有「萌」的感情……(笑)
koshiro666 +
2007/10/01 13:37
在香港出這種東西恐怕不可能
這一定會在唱片公司反對下被打成禁賣品~
mmssm +
2007/10/01 13:36
其實以電腦唱歌比說話更容易
人的對話有語氣,通過不同語調表逹,否則聽起來超怪
但唱歌只需跟旋律,我聽過某些初音的曲,編得好的也真的叩人分不出是否真人唱
天河明人 +
2007/10/01 13:20
>>影翠
可以講解一下這程式的基本原理嗎?

我估計如下,有錯請指正。
邀請聲優藤田咲,讀出50音。
透過不同的組合,這已經可以達到讀出詞句。
但是,聲音音調會很怪,因為只是播出錄音。
要說得好聽,唱得好聽,聲調必須經過調整。

聲音以聲波傳遞,有頻率、波長和波腹。
在電腦中以三角涵數記載資料。
把一首歌曲電子化後便可看見其聲紋。

我估計調整聲調的方法,是把藤田咲讀出歌詞的聲紋盡量和歌曲某部分(應該是樂曲)聲紋相似。

不知道有沒有猜錯...
影翠 +
2007/10/01 12:58
>柏木
那又不是
廣東的9音其實仍是較少的
如果以主音計算,英語有12個,更有語言有20個母音的
所以即使是要唱出來,已令寫程式的叫救命
何況現在的要求是要唱得有如真人一樣
現在的初音仍和此有很大的差距

想問有沒有人能要初音唱西班牙文?
西班牙文和日文都是五個母音,可能可以要她跳隻拉丁舞XD
TinTIn Homepage +
2007/10/01 12:47
日文和中文不同吧...50 音,所能組合的可能性有限......但是廣東話複雜很多很多(就算英文也一樣)
闇之大精靈 +
2007/10/01 12:17
請問有沒有人知道那首被評為觀鈴親唱的初音版鳥之詩是否已被製作人自主回收?
找了很久也找不到
柏木 +
2007/10/01 11:58
反過來說,只要成功制作港版初音
那世界上大部分的語言都能夠唱出來了
影翠 +
2007/10/01 11:50
>畢竟,好像沒有什麼可能把語言程式化

沒法,因為在語言學和電腦合力下,要完美的做出人聲已是登天的事.初音的技術是現今語言學較簡單的一環,所以才能有較高度的發展.單是將它廉價發售已令人頭痛.

初音以日版能唱港台語,原因是因為世界所有語言在聲學,語音學上是有相當大程度的共通點.但是,港語的主音音標是9個<---沒有記錯的話,但日本只有五個(a,i,u,e,o),加上只有上下兩聲,所以要港版出現,可真的是麻煩事一件.
初音能以15000yen發售其實已是一大突破,價錢/品質比較以前的東西好太多了.
要電腦自己說語,那要語言學,電腦加上認知科學的人努力了,希望有生之年能看到chobits^^
分頁: 1/2 第一頁 1 2 下頁 最後頁
發表評論
表情
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emot
開啟HTML
開啟UBB
開啟表情
隱藏
記住我
暱稱   密碼   訪客無需密碼
網址   電郵   [註冊]