เมษายน 27, 2024, 06:26:25 PM *
ยินดีต้อนรับคุณ, บุคคลทั่วไป กรุณา เข้าสู่ระบบ หรือ ลงทะเบียน

เข้าสู่ระบบด้วยชื่อผู้ใช้ รหัสผ่าน และระยะเวลาในเซสชั่น
ข่าว: AVC เปิดเฟสและโซเชี่ยลใหม่ เพื่อนๆช่วยกดไลค์ติดตามด้วย
เวบเข้าสู่ปีที่ 15 แล้ว ท่านสามารถช่วยเหลือเวบได้โดยสมัคร VIP (ตลอดชีพ) อ่านคอมเมนท์จากผู้ใช้งานจริง ที่นี่
 
   หน้าแรก   ช่วยเหลือ เข้าสู่ระบบ สมัครสมาชิก  
0 สมาชิก และ 1 บุคคลทั่วไป กำลังดูหัวข้อนี้ « หน้าที่แล้ว ต่อไป »
หน้า: [1] 2 3 ... 13 พิมพ์
ผู้เขียน หัวข้อ: ใครอยากลองทำ Sub Title แบบแปลเองไหมครับ !! มา มาลองกัน  (อ่าน 19592 ครั้ง)
หมูดำรำพัน
AV Columnist
ผู้บัญชาการเอวีสูงสุด
***
ออฟไลน์ ออฟไลน์

กระทู้: 1101


โลกสวยด้วยมือเรา..และหนังอีก 6TB!


« เมื่อ: พฤศจิกายน 03, 2023, 09:18:45 PM »



ที่มาคือผมได้เข้าไป Web ดู online นึงมันมี Subtile ภาษาอังกฤษด้วย แล้วมันมี Remark ว่า AI Generated Subtitle ก็เลยนึกขึ้นมาได้ว่า เดียวนี้ AI มันฉลาดขึ้นมาก อย่างเช่นเมื่อก่อนถ้ามีใครบอกว่ามี Program ถอดเซ็นเซอร์ได้ มันต้องหลอกกินตังค์กูแน่ๆ แต่ลองมาดูตอนนี้สิ คงรู้ๆกันว่ามันใกล้เคียงมากจริง (จิ๋ม AI 555)

ก็เลยลองคิดว่าพวก Speech recognition มันน่าจะมาไกลแล้วเหมือนกัน Search ดูเหมือนมีหลายวิธี หลาย Program แล้วมาเจอ Program Subtitle Edit ที่มีคนใช้ Generate Sub ที่เป็นภาษาอังกฤษได้ ไปลองอ่าน Note ดูพบว่าเฮ้ย มันรองรับภาษา JP ด้วยนี่หว่า น่าลอง..

ตอนแรกมันเป็น Version 3.XX แล้วมันต้อง Load Model (ข้อมูลที่วิเคราะห์คลื่นเสียงให้มาเป็นข้อความนี่ละครับ) มีขนาดเล็กๆ  70 กว่า MB จนถึงเป็น GB ลองดูกับเครื่อง NB บ้านๆที่มีอยู่นี่ละ (ถ้าเครื่อง GPU ยิ่งแรงยิ่ง Gen ไว) ออกมาค่อนข้างไม่ประทับใจเท่าไหร่ ก็พัก Project ไปก่อน

จนกระทั่งมันมี Major Update ใหม่เป็น 4.00 (ล่าสุด 4 Nov 2023 เป็น 4.01) ออกมาพบว่ามันแม่นขึ้นมากๆๆ ผมใช้ Model Small ขนาด 472MB ด้วย Engine Purfview's Faster Whisper หนังเรื่องนึงใช้เวลาไม่ถึงชม. โดยผมจะ Gen ให้เป็นภาษา Engligh ก่อน แล้วค่อย Translate ด้วย SubTitle Edit เองนี่ละ ให้เป็น Thai อีกที เพราะอะไร เดี๋ยวเหลาให้ฟังครับ

วิธีการนะครับ
1) Download Setup File ของ SubtitleEdit ก่อน ที่ https://github.com/SubtitleEdit/subtitleedit/releases ผมเลือก .zip แล้ว unzip เพื่อ Setup อีกที
2) เข้า Program แล้วไปที่ Option --> Setting แล้วกด Download mpv lib เพื่อจะได้ Preview ดูตอนเรา Edit Subtitle ได้


3) ต่อไปเราจะต้อง Download model ที่จะให้วิเคราะห์เสียงกัน ผมลองหลายๆวิธี ตัวที่เหมากับเครื่อง NB ที่ใช้คือแบบนี้ครับ
Menu Video --> Audio to Text (Whisper)
Choose language เลือก "Japanese"
Choose model คลิกที่ "..." แล้วเลือก Model ที่ต้องการ ผมเลือก small (472 MB) แล้วกด "Download" Program จะ download model ตามที่เลือกมาติดตั้งให้เลย ใครจะลองจากเล็กๆ tiny, base ก่อนก็ได้ครับ เวลาจะเร็วช้าตามขนาด แต่ยิ่งเล็กความแม่นจะลดลงไปครับ ผมยังไม่เคยลองที่ใหญ่กว่า small เพราะเหมือนยิ่งใหญ่ จะใช้เวลามากขึ้นอีก ผมว่า 1ชั่วโมงก็นานพอละ



4) ตอนนี้ให้ Cancel ออกมาก่อนครับ มาเลือกหนังกัน ให้เข้า Menu Video --> open video file แล้ว Browse File ที่ต้องการได้เลย รองรับ Video Format ที่เราดูๆกันอยู่นี้ละ ตัวอย่างผมลอง SSIS-853 หนัง Debut Yuka Murakami (แบบถอด Cen) มาลองดู น่าจะมีการพูดคุยเยอะอยู่

มันจะแสดง Preview ด้านขวาบนให้ดูด้วย อย่าดูเพลิน เรามาทำงานก่อน.. มันโหลดแล้ว เราก็ Click ด้านขวาล่างของจอมันจะอ่าน Audio ของหนังมาเป็น Wave ให้เราดูก่อน แล้วเลือก
  • select current subtitle while playing ไว้ด้วยนะครับ เวลาเล่นไป มันจะเลือก Sub ที่ให้ตรงอัตโนมัติ


5) ที่นี้ถึงเวลา Gen Subtitle ละครับ ก่อนอื่น มันจะใใช้เวลา Gen นานมาก ผมก็กันใครมาดูหน้าจอ เอา Preview ออกก่อนได้ด้วยการเลือก Toolbar นี้ครับ


เลือก Menu view --> Audio to text (Whisper) อีกที คราวนี้เลือก Langauge "Japanese", Choose Model "small" แล้ว "Generate" โลดครับ

ุ6) รอ... ถ้าไม่อยากรอก็ทำอย่างอื่นไปก่อน ขี่ม้า ดูละครเวที เตะบอล .. (ใคร Get ก้ไม่เด็กละครับ) มันจะคำนวณเวลาที่ใช้ใให้ครู่นึง แล้วจะบอกมาครับ เร็วช้าขึ้นกับความเร็วเครื่องและขนาด model ที่ใช้ละครับ

... Few minutes Later...

7) เสร็จแล้ว... จะได้ Subtitle ภาษา Japan ออกมาแล้วววว อ่า มาได้ครึ่งทางละครับพี่น้อง


Cool ผมจะ Save sub jp ไว้ก่อน อุตส่าห์ Gen มาตั้งนาน ให้ File-->Save มันจะตั้งชื่อเหมือนชื่อ File แล้วนามสกุล .srt ผมจะใส่ .jp. ไว้ให้นิดนึงเป็น xxxx.jp.srt ครับ

9) แปลงเป็น English ก่อนโดยเลือก Menu Auto-Translate-->Auto-Translate


เลือก Service เป็น Google Translate V1 API (ตอนเลือกเครื่องต้องต่อ Internet นะครับ เพราะมันส่งไปให้ Google แปล)



เสร็จแล้วก็ OK ออกมา


จะเห็นว่า Original Japan จะอยู่ทางขวา แล้ว Engligh อยู่ทางซ้ายนะครับ

10) Save Version English ก่อน โดยเลือก File-->Save As จะได้ชื่อเดิมแต่จะมี .en.srt ให้เลย

11) อย่าเพิ่งออกนะครับ ไปแปล Thai ต่อ โดยเลือก Auto-translate --> Auto-translate คราวนี้ก็เลือก From Engligh to Thai ได้เลย ให้มันแปลแป๊บนึง ก็ OK ออกมาก

12) คราวนี้ Original มันจะกลายเป็น Engligh แล้วด้านซ้ายจะเป็น Thai แทนละ คราวนี้เราก็ Save As อีกที จะได้ File เดิมนามสกุล .th.srt มาเลย

ได้ละครับขั้นตอนแรก ... แต่เดี๋ยวก่อน ยังไม่จบครับ เพราะมันยังไม่ถูกต้อง 100% หรอกกครับ ผมว่าได้สัก 60-70% เดี๋ยวเรามาเกลากันหน่อย..

ได้ละครับ แต่ที่ว่าต้องมีการเกลากันอีกหน่อย มันก็มาจากความที่มันถูกต้องประมาณ 60-70% นี่ละครับ สิ่งที่เจอบ่อยๆ (แหมยังกะเชี่ยว เรียกว่าเป็นข้อสังเกตุละกันครับ)

1) ความถูกต้องของการ gen จะขึ้นกับความชัดเจนและคุณภาพของเสียงพูดด้วย เช่น ความเร็ว ความดัง เสียงรบกวน หรือตัว Model เอง ซึ่งเราก็ไปสั่งให้คนในเรื่องมันพูดช้าๆ ชัดๆคงไม่ได้ มันก็ว่ากันไปตามท้องเรื่องนั่นละ บางทีก็กระซิบกระซาบ บางทีก็ดังซะชัดเชียว

2) ถ้าแปลเป็นไทยจาก Japan เลย สิ่งที่แปลเป็นไทย มันจะอ่านแล้วแหม่งๆ แล้วเราก็ไม่รู้ว่ามันมาจาก Japan ที่มันได้ยินว่าอะไร บางทีการเป็น English ก่อนมันจะทำให้เราพอ "เดา" ความหมายจริงๆที่มันควรจะเป็นได้ หรือเรามาแต่งให้เป็นภาษาพูดที่คนพูดปกติได้ เช่น Cup ซึ่งหมายถึงขนาดหน้าอก มันจะแปลว่าถ้วย เราก็มาแปลงให้มันเป็นคำว่าหน้าออกเอาเอง

3) เวลามีการพูดหลายๆคนสลับกัน ชาย หญิง มันแปลเป็น Eng ก่อน พอเป็นภาษาไทย เช่น I มันจะใช้คำว่า "ฉัน" ไปหมด เราก็มาปรับให้มันเป็น "ผม" "หนู" "ชั้น" อะไรก็ตามที่ในนั้นพูดจริงๆไปครับ แล้วก็ใช้การ Split แยกประโยคให้สลับ ชาย หญิงเอาเอง


4) เสียงคราง อันนี้หลายท่านที่เคยเล่นก็บอกว่ามันค่อนข้างมั่ว ส่วนใหญ่จะไปทางไม่ค่อยแปล บางทีก็แปลมาเป็นตับเลยก็มี แล้วระยะเวลาก็ยาวแบบหลายๆสิบวิ ก็มี ไม่ค่อย Sync กับเสียงจริง เราก็ต้องมาเคยดูจาก Wave ด้านล่างแล้วมาตัดเอา

ที่ผมแนะนำว่าให้เป็น Eng แล้วค่อยมาไทยจะมีเทคนิคให้การเกลานิดหน่อยคือ
1) ผม Open file th.srt ขึ้นมาก่อน ถ้า File หนั่งมันอยู่ Folder เดียวกันมันจะเปิด Preview หนังขึ้นมาให้เลย
2) แล้วผมก็จะเปิด file .en.srt มาคู่กันโดยการใช้ File -> Open Original Subtitle (translator mode) ทีนี้มันจะมีไทยทางซ้าย Eng ทางขวา

3) จากรูป ภาษาไทยมันแปลว่า "วันนี้ได้เลขอะไรคะ?" จากภาษา Eng "What number is it today?" แต่เดาว่าน่าจะหมายถึง วันนี้เป็นเรื่องที่เท่าไหร่มากกว่า เพราะเป็นหนังเรื่องที่สองของน้องเค้า  มีตอนนึงคนถามถามว่าเคยทำงานอะไรมาก่อน น้องเค้าบอกว่าเป็นไกด์นำเที่ยวรถบัส (ถ้าจริงก็ไม่แปลกเลย พูดเก่งมากๆ) คนถามแหย่ว่า ระหว่างขับรถไป ก็มี Sex กับคนขับไปด้วยใช่ไหม (ตรงนี้แปลโคตรตรง) น้องเค้าบอกไม่ได้ๆ โดนไล่ออกแน่ แล้วก็มีประโยคว่า "ไม่เป็นไรถ้าเธอไม่รู้ เธอจะรู้เอง
ตอนนี้ฉันมีเครื่องบันทึกการขับรถของเธอแล้ว" มาจาก "It's okay if she doesn't find out.She will find out.I have her drive recorder now." ก็เดาว่า มันแหย่ต่อว่า ถ้าเค้าไม่รู้ก็ okay มั้ง น้องเลยตอบว่า เค้ารู้สิ มันมีกล้องบันทึกในรถด้วย

ก็ปรับๆ เหลาๆไปครับ ถ้าขยันทำงานแบบแปล Sub นี่ผมคงเป็นเจ้าของบริษัทไปแล้ว 5555

จบละครับ ขอให้สนุกสนานกับการแปลด้วยมือเรานะครับ !!

« แก้ไขครั้งสุดท้าย: พฤศจิกายน 07, 2023, 05:48:54 PM โดย หมูดำรำพัน » บันทึกการเข้า

osiris777
ผู้ชำนาญการเอวี
*
ออฟไลน์ ออฟไลน์

กระทู้: 125


« ตอบ #1 เมื่อ: พฤศจิกายน 03, 2023, 11:34:43 PM »

อยากทำครับ แต่ผมไม่มีแหล่งหาหนัง
บันทึกการเข้า
asura7
AV Dedicator (VIP)
โอตาคุกิติมศักดิ์
***
ออฟไลน์ ออฟไลน์

กระทู้: 228



« ตอบ #2 เมื่อ: พฤศจิกายน 03, 2023, 11:34:52 PM »

สนใจมากครับ  จัดมาเลย
บันทึกการเข้า
teerachaikssl
AV Donator (VIP)
ปลิงควาย
***
ออฟไลน์ ออฟไลน์

กระทู้: 23


« ตอบ #3 เมื่อ: พฤศจิกายน 03, 2023, 11:57:30 PM »

อยากทำครับ แต่ไม่รู้จะหาซับได้ที่ไหนครับ
บันทึกการเข้า
vpdarkside
AV DecadonoR++ (VIP)
วุฒิสมาชิกเอวี
*
ออฟไลน์ ออฟไลน์

กระทู้: 422


« ตอบ #4 เมื่อ: พฤศจิกายน 04, 2023, 12:19:46 AM »

แนะนำหน่อยครับ ผมพยายามลองละ ไม่ work คิดว่ายังหา tool ที่เหมาะสมไม่ได้
บันทึกการเข้า

รับ โหลด/หา งาน Gravure
http://www.avcollectors.com/board/index.php?topic=230469.10
mizuirO
AV Distinctive (VIP)
คณะปฏิสนธิแห่งชาติ
***
ออฟไลน์ ออฟไลน์

กระทู้: 752



« ตอบ #5 เมื่อ: พฤศจิกายน 04, 2023, 12:35:07 AM »

ถ้าอธิบายแบบทีละขั้นตอนจะดีมากเลยฮะ ผมก็อยากลองทำเองเหมือนกัน
บันทึกการเข้า

N E X T ?
mhudom
หมู่เฮาชาว AVC
AV DecadonoR++ (VIP)
ผู้บัญชาการเอวีสูงสุด
*
ออฟไลน์ ออฟไลน์

กระทู้: 2759



« ตอบ #6 เมื่อ: พฤศจิกายน 04, 2023, 06:02:35 AM »

เล่ามาให้ละเอียดเลยครับ
บันทึกการเข้า

อาวุธใหม่ ปลดปล่อยไฟล์หนังสู่ HDD ของคุณ
หนังใหม่เดือนชนเดือน , หนังเก่าที่เคยพลาดไป
ด้วย ExtMatrix สำหรับ VIP++ เท่านั้น
https://www.avcollectors.com/board/index.php?topic=237325.0
หมูดำรำพัน
AV Columnist
ผู้บัญชาการเอวีสูงสุด
***
ออฟไลน์ ออฟไลน์

กระทู้: 1101


โลกสวยด้วยมือเรา..และหนังอีก 6TB!


« ตอบ #7 เมื่อ: พฤศจิกายน 04, 2023, 03:33:35 PM »

อยากทำครับ แต่ไม่รู้จะหาซับได้ที่ไหนครับ

ไม่ต้องหาครับ เรามาทำเองกันได้เลย!!
บันทึกการเข้า

หมูดำรำพัน
AV Columnist
ผู้บัญชาการเอวีสูงสุด
***
ออฟไลน์ ออฟไลน์

กระทู้: 1101


โลกสวยด้วยมือเรา..และหนังอีก 6TB!


« ตอบ #8 เมื่อ: พฤศจิกายน 04, 2023, 03:34:15 PM »

ถ้าอธิบายแบบทีละขั้นตอนจะดีมากเลยฮะ ผมก็อยากลองทำเองเหมือนกัน

Update วิธีให้ละครับ ไม่ยาก
บันทึกการเข้า

หมูดำรำพัน
AV Columnist
ผู้บัญชาการเอวีสูงสุด
***
ออฟไลน์ ออฟไลน์

กระทู้: 1101


โลกสวยด้วยมือเรา..และหนังอีก 6TB!


« ตอบ #9 เมื่อ: พฤศจิกายน 04, 2023, 03:34:49 PM »

อยากทำครับ แต่ผมไม่มีแหล่งหาหนัง

หนังที่เรามีนี่ละครับ ลุยเลย
บันทึกการเข้า

หน้า: [1] 2 3 ... 13 พิมพ์ 
« หน้าที่แล้ว ต่อไป »
กระโดดไป:  












AV Community Since 2009 : AVCollectors.com - Advertising please contact [email protected]