รหัสภาษา
สำหรับการทำเว็บที่เป็นภาษาไทยที่นิยมคือ TIS-620 และ WINDOWS-874 ส่วน UTF-8 มีแนวโน้มการใช้งานเพิ่มขึ้น
TIS-620
เป็นรหัสภาษาไทยที่กำหนดโดยหน่วยงานของไทย (สมอ., สมาคม มาตรฐาน อุตสาหกรรมไทย, Thai Industrial Standard) รหัสนี้ยืนอยู่บนฐานของ ASCII
WINDOWS-874
เป็นรหัสภาษาไทยที่ไมโครซอฟท์กำหนดขึ้นมา เพื่อใช้ใน Windows ต่อยอดมาจาก TIS-620 อีกที ยังไม่ได้รับการรับรองมาตรฐาน จากหน่วยงานระดับโลก
(แต่คนใช้มันเยอะ เป็นเจ้าตลาด ต่อให้ไม่มาตรฐาน แล้วใครละ สนมาตรฐาน! )
UTF-8
เป็นรหัสภาษานานาชาติ หรือ Unicode และภาษาไทยก็บรรจุเป็นส่วนนึงของ Unicode ด้วยเช่นกัน
ทั้ง TIS-620 และ UTF-8 เป็นการเข้ารหัสที่เป็นมาตรฐานแล้วทั้งคู่ สำหรับ Browser ทั้ง IE, FF , Safari, Opera สนับสนุนทั้งสองมาตรฐานใช้งานได้ไม่มีปัญหา สำหรับงาน Web Design หรืองานที่มันเสร็จไปเป็นโครงการๆนึง อันนี้ไม่น่าจะมีปัญหาอะไร ว่าจะเลือกแบบไหน ที่มันจะมาเป็นประเด็น ก็เป็นกับส่วนของการ Programming เป็นหลัก
แนวทางการทำงาน ของเราซึ่งมีการนำ Open Source มาใช้ในหลายๆส่วน มันจะมีปัญหาที่ Open Source บางตัวเขาทำมาเพื่อชาวโลก เขาเลือกที่จะรองรับ UTF-8 โดยไม่รองรับ TIS-620 หรือรหัสภาษาท้องถิ่นอื่นๆ (ไม่งั้นมันต้องทำงานหลายภาษา มันก็อาจจะลำบากเขา)
แต่ก็ไม่มีปัญหาอะไร เพราะถึงมันจะเป็น UTF-8 แต่มันก็ใช้งานภาษาไทยได้อยู่แล้ว นำมาใช้ได้เลยไม่มีปัญหา … ปัญหาถ้าจะมีก็ต่อเมื่อต้องมีการ ส่ง หรือ รับข้อมูล จากโปรแกรมอื่น หรือ module อื่นๆถ้ามันใช้รหัสไม่ตรงกัน ก็ต้องเขียนโปรแกรมแปลงมาครอบไว้ เช่น… ถ้าเราจะเอา ภาพและคำบรรยายภาพจาก script ที่ใช้ UTF-8 ไปแสดงในส่วนของ Blog ถ้า Blog เป็น TIS-620 ข้อมูลจาก script ที่เป็น UTF-8 จะอ่านไม่ออก ถ้าไม่แปลงผลก่อน ในทางกลับกันก็จะมีปัญหาเหมือนกัน
หรืออย่างถ้าเราจะทำ Link จากเว็บเราไป social bookmark โดยปกติเราจะทำปุ่ม link ไว้ แล้วใส่ข้อความหัวข้อไว้ใน parameter title แต่ถ้า อย่าง Zickr, del.icio.us, Digg หรืออันอื่นที่ใช้ UTF-8 ในระบบของเขา พอรับ title ที่เราส่งจากของเราแบบ TIS-620 ไป มันก็จะขึ้นเป็นตัวยึกยือๆ….
จะไม่มีปัญหาอะไรเลย ถ้าจะใช้รหัส TIS-620 หรือ UTF-8 ถ้าเราไม่ได้ใช้มันข้ามกัน … ถ้าใช้ข้ามกัน ใช้ร่วมกัน ต้องมีการแปลงนั่นปรับนี่สักหน่อย ยากง่ายว่ากันไป
UTF-8 มีข้อดีตรงที่ว่า ใน 1หน้าเว็บนั้น เราสามารถแสดงผลร่วมกันได้ ในหน้านั้นจะมีภาษาไทย อังกฤษ จีน ญี่ปุ่น อ๊าา อ๊าา ตั้ม ตั้ม ซาอุ สวีเดน ฯลฯ มันแสดงผลร่วมกันได้เลยใน 1 หน้า แต่ถ้าเราเลือกเป็น TIS-620 ตรงภาษาอื่นๆ มันจะอ่านไม่ออกเพราะรหัสนี้มีแค่ ภาษาไทย กับ อังกฤษ
TIS-620 มีข้อดีตรงที่ว่า .. ในช่วงที่เป็นข้อความภาษาไทย ถ้าเป็น UTF-8 จะใช้พื้นที่เยอะกว่าถึง 2-3 เท่าตัว (ตรงภาษาอังกฤษ ใช้พื้นที่เท่าเดิมคือ 1 byte) พื้นที่เยอะ ไม่ได้หมายถึงว่าจะกระทบกับพื้นที่ใน Harddisk อย่างเดียว (Harddisk เราค่อนข้างเหลือเฟืออยู่แล้ว) มันจะมีผลกับการรับส่งข้อมูล 2-3 เท่าตัว ถ้าเป็นหน้าที่ไม่มีอะไร บอกแค่ว่า “ได้รับข้อมูลแล้ว ขอบคุณที่ร่วมกิจกรรม” แค่นี้คงไม่ต่างอะไรมาก แต่ถ้ามันเป็นหน้าที่มีข้อมูลจำนวนเยอะ มีข้อความเยอะมาก อย่างใน Community ใน Webboard อันนี้จะเริ่มเห็นความต่าง ทางด้านความเร็วแล้ว …
หลายๆบทความ สนับสนุนให้ใช้ UTF-8 โดยให้เหตุที่ไม่ค่อยชัดเจนเท่าไหร่ เพราะว่ามันใหม่กว่า ดีกว่า แพร่หลายกว่า … ผมว่าบางทีต้องมองกลุ่มเป้าหมาย และชิ้นงานของเราด้วย ว่าอันไหนเหมาะกับเรา เห็นบางแห่งพิมพ์บอกว่าถ้าใช้ TIS-620 จะมีปัญหากับ AJAX ที่ดึง XML ภาษาไทยมาแสดง อันนี้ขอบอกว่าไม่จริงเสียทีเดียว เพียงแค่กำหนด
ไว้ในส่วนหัวของ XML ก็ใช้งานได้เหมือนกัน …
ข้อดีในเชิงปฎิบัติของ UTF-8 ก็คือถ้าเรานำเอา Software ที่รองรับ UTF-8 มาใช้ ก็ใช้ได้เลย ไม่ต้องไป mod อะไรอีก เพราะ UTF-8 ก็ใช้งานภาษาไทยได้อยู่แล้ว เพราะบางโปรแกรมถ้า mod ตรงนี้มันต้องแก้หลายจุด แต่จริงๆถ้ามันรองรับ TIS-620 ได้โดยไม่ต้องแก้อะไรมาก เราจะใช้ TIS-620 ก็ไม่มีปัญหาอะไรเหมือนกันอีกนั่นแหละ