Download as pdf or txt
Download as pdf or txt
You are on page 1of 12

กสจ.

102
แบบเสนอโครงการวิจัย

1. ชื่อโครงการวิจัย (ภาษาไทย) ระบบการวิเคราะห์ขอ้ ความภาษาไทยจากเครื อข่ายสังคมออนไลน์


(ภาษาอังกฤษ) Social Network Text Analytics System
2. ประเภทของทุนวิจัย (นักวิจัยรุ่นใหม่ นักวิจัยที่มีประสบการณ์ เคยมีผลงานตีพิมพ์ ในวารสาร วิชาการระดับ
สถาบัน/ชาติหรื อนักวิจัยที่ มีประสบการณ์ มีผลงานตีพิมพ์ ในวารสารวิชาการระดับนานาชาติ)
นักวิจยั รุ่ นใหม่
3. ประเภทของงานวิจัย (งานวิจัยพืน้ ฐานหรื องานวิจัยประยุกต์) งานวิจยั ประยุกต์
4. คณะผู้ดาเนินงานวิจัย (โปรดระบุรายละเอียดของคณะผู้ดาเนินการวิจัยทุกคนเรี ยงตามลาดับ นักวิจัยที่ปรึ กษา
(ถ้ ามี) หั วหน้ าโครงการและผู้วิจัยร่ วม (ถ้ ามี) ฯลฯ)
(1) ชื่อ (ภาษาไทย) ผศ. ดร.ศุภฤกษ์ มานิตพรสุ ทธ์ (หัวหน้ าโครงการวิจัย)
(ภาษาอังกฤษ) Assist. Prof. Suparerk Manitpornsut, PhD
คุณวุฒิ ระดับปริ ญญาเอก
ตาแหน่ง หัวหน้าสาขาวิชาวิศวกรรมคอมพิวเตอร์และมัลติมีเดีย คณะวิศวกรรมศาสตร์
สาขาวิชาที่เชี่ยวชาญ (ระบุได้มากกว่า 1 สาขาวิชา) ไฟฟ้ า, อิเล็กทรอนิกส์, โทรคมนาคมและคอมพิวเตอร์
ประวัติการทาวิจยั และการตีพิมพ์ผลงานวิชาการ ดังนี้ :
1) การได้รับทุนส่ งเสริ มการวิจยั ของมหาวิทยาลัยฯ (เฉพาะกรณี เป็ นหัวหน้ าโครงการวิจัย) เรื่ อง
(1) การจัดการทรัพยากรช่องสัญญาณสาหรับเครื อข่ายแลนไร้สายที่มีความหนาแน่นสู งโดย
ใช้วธิ ี การจัดกลุ่ม, พ.ศ. 2554
2) การได้รับทุนเพื่อทาวิจยั จากหน่วยงานภายนอก
(1) ชุ ด วิจ ัย เรื่ อ ง “การจัด การภัย พิ บ ัติ ส าหรั บ วิ ก ฤตของโลจิ ส ติ ก ส์ แ ละโซ่ อุ ป ทานของ
โครงสร้ างพื้นฐาน” โครงการย่อยที่ 2 เรื่ อง “การเตรี ยมความพร้ อมโลจิสติกส์ ใน
การตอบสนองภัยพิบตั ิสาหรับสภากาชาดไทย”, สานักงานกองทุนสนับสนุ นการ
วิจยั , พ.ศ. 2556
3) การตีพิมพ์ผลงานในวารสารวิชาการ
(1) ชื่อผลงาน Weighted Channel Allocation and Power Control for Self-Configurable
Infrastructure WLANs
ชื่อวารสาร Journal of Interconnection Networks
ฉบับที่ 9 ปี ที่ 2008 ค่า Impact Factor (ถ้ามี)
วารสารระดับ (สถาบัน/ชาติ/นานาชาติ) นานาชาติ

(2) ชื่อผลงาน Analysis of the Behavior of Self-similar Traffic in QoS-Aware Architecture


for Integrating WiMAX and GEPON
2
ชื่อวารสาร Journal of Optical Communications and Networking
ฉบับที่ 4 ปี ที่ 2009 ค่า Impact Factor (ถ้ามี)
วารสารระดับ (สถาบัน/ชาติ/นานาชาติ) นานาชาติ

(3) ชื่อผลงาน Improving densely deployed wireless network performance in unlicensed


spectrum through hidden-node aware channel assignment
ชื่อวารสาร Performance Evaluation
ฉบับที่ 9/68 ปี ที่ 2011 ค่า Impact Factor (ถ้ามี) 1.25
วารสารระดับ (สถาบัน/ชาติ/นานาชาติ) นานาชาติ

5. ความสาคัญและทีม่ าของปัญหาที่ทาการวิจัย
ภาพลักษณ์องค์กรเป็ นสิ่ งสาคัญต่อการทาธุ รกิจในทุกรู ปแบบ องค์กรที่มีภาพลักษณ์ดี ทาให้เกิดผล
บวกต่อการดาเนิ นธุ รกิจ ส่ วนองค์กรที่มีภาพลักษณ์ไม่ดีสามารถแก้ไขหรื อปรับปรุ งได้ แต่ตอ้ งได้รับการ
ปรับปรุ งอย่างทันท่วงที เนื่องจากภาพลักษณ์ที่เสี ยไปแล้วนั้นแก้ไขได้ยาก
ภาพลักษณ์ องค์กรอาจเกิ ดจากกิ จกรรมต่างๆ ที่องค์กรวางแผนไว้และเผยแพร่ ต่อสาธารณะ หรื อ
อาจเกิดจากสิ่ งที่ผบู ้ ริ โภคสิ นค้าหรื อบริ การจากองค์กรนั้นรับรู ้จากสื่ อชนิดต่างๆ
ในเศรษฐกิ จยุค ดิ จิตอลอย่า งในปั จจุ บ นั ผูบ้ ริ โภคสามารถเข้า ถึ ง สื่ อต่ า งๆ ได้อย่า งรวดเร็ วและ
กว้างขวาง สื่ อสังคมออนไลน์เป็ นหนึ่งในแหล่งข้อมูลที่ผบู ้ ริ โภคเสพเนื่ องจาก ข้อมูลเหล่านั้นมักมาจาก
เพื่อน หรื อคนที่รู้จกั ด้วยเหตุน้ ี การติดตามภาพลักษณ์ องค์กรผ่านเครื อข่ายสังคมออนไลน์จึงเป็ นสิ่ งที่
องค์กรธุ รกิจใช้เป็ นเครื่ องมือในการสารวจผลการตอบสนองจากผูบ้ ริ โภค
อย่า งไรก็ ตาม ข้อมู ล ที่ ไ ด้จากสื่ อสังคมออนไลน์มี ความหลากหลายของรู ปแบบและมี ปริ มาณ
จานวนมาก เมื่อต้องการการประมวลผลให้เกิดความรวดเร็ ว และมีนยั สาคัญที่เหมาะสม
ระบบการวิเคราะห์ ขอ้ มูลในองค์กรแบบดั้ง เดิ ม คื อ ระบบความชาญฉลาดทางธุ รกิ จ (Business
Intelligence Systems) มักใช้เพื่อการประมวลผลข้อมูลเชิ งตัวเลข เช่น สรุ ปยอดขายรายไตรมาศ แนวโน้ม
ของกาไร เป็ นต้น ซึ่ งผลลัพธ์ของการประมวลผลเช่นนี้ ใช้งานได้ดีกบั การวางแผนเชิ งกลยุทธขององค์กร
ดังนั้นจึงสามารถเห็นการใช้งานระบบนี้อย่างกว้างขวางในองค์กรขนาดกลางและขนาดใหญ่
แต่กระนั้น ระบบความชาญฉลาดทางธุ รกิจไม่สามารถตรวจจับภาพลักษณ์องค์กรได้อย่างทันท่วงที
เนื่ องจาก ระบบทัว่ ไปมักมีขอ้ จากัดในเรื่ องการรองรับความหลากหลายของรู ปแบบข้อมูล โดยเฉพาะ
ข้อมูลที่เป็ นข้อความภาษาไทย ดังนั้นจาเป็ นต้องมีเครื่ องมือที่ใช้ในการวิเคราะห์ ที่รองรับคุณลักษณะของ
ข้อมูลดังกล่าว โครงการวิจยั นี้ จึงได้ถูกนาเสนอขึ้นเพื่อสร้างระบบที่สามารถวิเคราะห์ขอ้ ความภาษาไทย
จากสื่ อสังคมออนไลน์ และสะท้อนถึงภาพลักษณ์ องค์กร ซึ่ งสามารถนามาเป็ นส่ วนเสิ รมกับระบบชาญ
ฉลาดทางธุ รกิจในการวางแผนเชิงกลยุทธให้มีความรุ ดหน้าและก้าวทันเศรษฐกิจในยุคดิจิตอลได้
3
6. วัตถุประสงค์ ของโครงการวิจัย
6.1 เพื่อสร้ างต้นแบบระบบวิเคราะห์ ขอ้ ความภาษาไทยจากสื่ อสังคมออนไลน์ และสามารถ
นาไปใช้งานจริ งได้
6.2 เพื่ อ น าเสนอและประยุ ก ต์ใ ช้อ ัล กอริ ทึ ม การวิ เ คราะห์ ภ าษาไทย เช่ น การตัด ค า การจัด
หมวดหมู่ของข้อความ การวิเคราะห์ความรู ้สึกของข้อความ เป็ นต้น
6.3 เพื่อนาผลที่ได้จากการศึกษาวิจยั ไปตีพิมพ์เผยแพร่ ในวารสารหรื อการประชุ มวิชาการทั้ง
ระดับชาติและนานาชาติ

7. สมมติฐานของการวิจัย (ถ้ ามี)


8. ขอบเขตของการวิจัย
โครงการวิจยั นี้ นาเสนอเพื่ อพัฒนาอัลกอริ ทึมในการวิเคราะห์ ข ้อความภาษาไทยจากสื่ อสั ง คม
ออนไลน์ และจัดสร้างต้นแบบเพื่อให้ใช้งานจริ ง ดังนั้นขอบเขตของโครงการวิจยั จึงมีดงั นี้
 นาเสนอและจัดทาอัลกอริ ทึมในการวิเคราะห์ขอ้ ความภาษาไทยอย่างน้อย 2 อัลกอริ ทึม เช่น
การตัดค าจากข้อความภาษาไทย (Word Segmentation) และการวิเคราะห์ ความรู้ สึ ก ของ
ข้อความ (Sentiment Analysis) เป็ นต้น
 จัดทาระบบต้นแบบที่รองรับการวิเคราะห์ขอ้ มูลขนาดใหญ่ (Big Data Analysis) เช่น มีการ
ใช้งานระบบ HDFS (Hadoop Distributed File System) หรื อที่เทียบเท่า
 จัดทาระบบนาเสนอผลการวิเคราะห์ขอ้ ความภาษาไทยในรู ปแบบที่สามารถเข้าใจได้ง่ าย
เช่น การใช้กราฟในรู ปแบบที่เหมาะสม เป็ นต้น

9. ประโยชน์ ทคี่ าดว่าจะได้ รับ


9.1 สามารถนาระบบต้นแบบมาใช้เพื่อวิเคราะห์ ข ้อมูล จากสื่ อสัง คมออนไลน์ที่ เกี่ ย วข้องกับ
มหาวิทยาลัยหอการค้าไทย สถาบันอื่นที่เป็ นพันธมิตร หรื อคู่แข่งได้ และเครื่ องต้นแบบที่
พัฒนาขึ้น สามารถนามาใช้งานได้จริ งหรื อเพิม่ เติมประสิ ทธิ ภาพให้มากขึ้นได้ภายหลัง
9.2 สามารถใช้เป็ นส่ วนเสริ มกับระบบชาญฉลาดทางธุ รกิ จเพื่อช่ วยในการวางแผนเชิ งกลยุทธ
ของมหาวิทยาลัยได้
9.3 ได้องค์ความรู้ ใหม่ในการประมวลผลข้อความภาษาไทย และอาจนาไปใช้งานอื่ นร่ วมกับ
หน่วยงานธุ รกิจต่างๆ ที่มีความสัมพันธ์ของมหาวิทยาลัย เช่น หอการค้าจังหวัดต่างๆ เป็ นต้น
9.4 ผลที่ได้จากการศึกษาวิจยั สามารถนาไปตีพิมพ์เผยแพร่ ในวารสารหรื อการประชุมวิชาการ
ทั้งระดับชาติและนานาชาติ
4
10. เอกสารและผลงานวิจัยที่เกีย่ วข้ อง
สื่ อสังคมออนไลน์ได้รับความนิยมจากผูใ้ ช้อินเตอร์เน็ตจานวนมาก ดูได้จากจานวนบัญชีผใู้ ช้ในสื่ อ
สังคมออนไลน์ยอดนิ ยมเช่ น Facebook, Twitter, LinkedIn, Blogger, Pinterest เป็ นต้น ที่ มีอตั ราเพิ่มขึ้ น
ของจานวนบัญชีผใู้ ช้อย่างต่อเนื่อง [1]
ข้อมูลในสื่ อสังคมออนไลน์เหล่านี้ มีรูปแบบที่หลากหลาย เป็ นได้ท้ งั ข้อความ รู ปภาพ ลิงค์ วิดีโอ
และอื่ นๆ ทาให้การประมวลผลข้อมูลที่ ได้จากสื่ อสังคมออนไลน์ไม่สามารถใช้เทคนิ คดั้งเดิ มได้ดีนกั
เนื่ อ งจากข้ อ มู ล เหล่ า นี้ เป็ นลั ก ษณะกึ่ งมี โ ครงสร้ า ง (Semi-Structured Data) หรื อไม่ มี โ ครงสร้ า ง
(Unstructured Data) [2]
การประมวลข้อ มู ล ขนาดใหญ่ (Big Data Analytics) [3] เป็ นแนวทางใหม่ ใ นการรองรั บ การ
ประมวลผลข้อมูลปริ มาณมากและมีรูปแบบที่หลากหลาย จึงเหมาะสาหรับนามาใช้กบั การประมวลผลใน
สื่ อสังคมออนไลน์
แฟล็ตฟอร์ ม (Platform) ที่ ได้รับการยอมรั บในการนามาใช้เพื่อประมวลผลข้อมูลขนาดใหญ่คือ
Apache Hadoop [4] ซึ่ งโครงการแบบเปิ ดเผยโค้ด (Open-Source Project) ที่รองรับการประมวลผลแบบ
กระจาย (Distributed Computing) สามารถเพิ่มขยายกาลังการคานวณ และมีเสถียรภาพสู ง
เนื่ องจาก Apache Hadoop รองรั บการประมวลผลแบบกระจาย ดังนั้นนักพัฒนาสามารถพัฒนา
โปรแกรมภายในกรอบงาน MapReduce (MapReduce Framework) และกรอบงาน YARN (Yet Another
Resource Negotiator Framework) ทาให้สามารถใช้การประมวลผลแบบกระจายได้อย่างเต็มที่
มีนกั วิจยั หลายท่านได้นาเสนอการประมวลผลข้อความภาษาไทย เช่น การตัดคาภาษาไทยโดยใช้
ฟี เจอร์ ข องข้อ ความ [5] ในขณะที่ ง านวิ จ ัย จาก [6] น าเสนออัล กอริ ทึ ม ในการตัด ค าภาษาไทยโดยมี
กระบวนการย่อย 2 ส่ วนคือ การตัดพยางค์ และการรวมพยางค์ การประมวลผลข้อความภาษาไทยยังได้
ถู ก เพิ่ ม เติ ม ความสามารถให้ ม ากขึ้ น เช่ น อัล กอริ ทึ ม [7, 8] สามารถวิเ คราะห์ ค วามรู้ สึ ก (Sentiment
Analysis) ได้เป็ นต้น
จากที่กล่าวมาข้างต้น งานวิจยั เกี่ยวกับการวิเคราะห์ขอ้ ความภาษาไทยยังไม่ถูกนาเสนอในรู ปแบบ
การประมวลผลแบบกระจาย ด้วยเหตุ น้ ี โครงการวิจยั นี้ จึ งมุ่งประเด็นไปที่ นาเสนออัลกอริ ทึมภายใต้
กรอบงาน MapReduce/YARN หรื อกรอบงานอื่นๆ ที่สนับสนุนการประมวลผลแบบกระจายบน Apache
Hadoop ในการวิเคราะห์ขอ้ ความภาษาไทย
5
11. ระเบียบวิธีวจิ ัย
11.1 การออกแบบเบือ้ งต้ น

รู ปที่ 1 ตัวอย่างของระบบการประมวลผลข้อความภาษาไทยจากสื่ อสังคมออนไลน์

จากรู ปที่ 1 องค์ประกอบของโครงการวิจยั นี้ มี 4 ส่ วนคือ ระบบนาเข้าข้อมูล (Data Acquisition


System) แหล่ ง เก็ บ ข้อมู ล ขนาดใหญ่ (Big Data Storage) โปรแกรมประมวลผลการวิเคราะห์ ข้อความ
(Social Analytics Engine) และโปรแกรมการแสดงผล (Visualization Engine)
ระบบนาเข้าข้อมูลใช้เพื่อนาข้อมูลจากแหล่งข้อมูล (Data Sources) ต่างๆ เข้าสู่ แหล่งเก็บข้อมูล
ขนาดใหญ่ โดยแหล่งข้อมูลที่เป็ นไปได้คือ สื่ อสังคมออนไลน์ที่นิยมใช้ในประเทศไทย ได้แก่ Facebook,
Twitter, Instagram, Foursquare, Pantip เป็ นต้น
แหล่งเก็บข้อมูลขนาดใหญ่ใช้เพื่อรองรับข้อมูลดิบ (Raw Data) ที่ได้จากระบบนาเข้าข้อมูล และ
ผลลัพธ์จากการวิเคราะห์ (Analytics Results) ที่ได้จากโปรแกรมประมวลผลการวิเคราะห์ขอ้ ความ
โปรแกรมประมวลผลการวิเคราะห์ขอ้ ความ คือ หัวใจหลักของโครงการวิจยั นี้ ผูว้ ิจยั นาเสนอ
อัลกอริ ทึมการประมวลข้อความภาษาไทยบนกรอบงาน MapReduce/YARN และ/หรื อบนกรอบงานอื่นๆ
ที่สนับสนุนการประมวลผลแบบกระจาย
โปรแกรมการแสดงผลใช้เพื่ อนาเสนอผลลัพ ธ์ ที่ ไ ด้จากโปรแกรมประมวลผลการวิเคราะห์
ข้อความ เป็ นส่ วนติดต่อกับผูใ้ ช้งาน ทางานผ่านเว็บบราวเซอร์
6
11.2 ข้ อมูลตัวอย่ างและการเก็บข้ อมูล
จากที่กล่าวไว้แล้วในหัวข้อก่อนหน้านี้ คือ ข้อมูลดิ บนั้นจะถูกนาเข้าวิเคราะห์ผ่านระบบนาเข้า
ข้อมูล แหล่งข้อมูลที่เป็ นไปได้คือ Facebook, Twitter, Instagram, Foursquare, Pantip เป็ นต้น
ข้อมูลดิบควรประกอบไปด้วย ข้อความภาษาไทยและ/หรื อภาษาต่างประเทศที่มีความยาวไม่เกิน
1000 อักขระ และข้อมูลประกอบ (Meta Data) โดยที่ขอ้ มูลประกอบนี้ จะแตกต่างกันตามแหล่งข้อมูลที่ใช้
เช่ น ข้อมูลดิ บจาก Facebook มีขอ้ มูลประกอบคือ PostID, PostDate, NumberOfLikes, NumberOfShares
เป็ นต้น ในขณะที่ขอ้ มูลประกอบจาก Instagram อาจมีขอ้ มูลประกอบ GeoLocation เพิ่มเติมขึ้นมา แต่ไม่
มี NumberOfShares ดังนั้น ระบบฐานข้อมูลแบบดั้งเดิมที่มีการกาหนดสกีม่าแบบคงที่จึงไม่เหมาะกับการ
เก็บข้อมูลดิ บเหล่านี้ ระบบจัดเก็บข้อมูลที่ผวู ้ ิจยั ออกแบบไว้คือ การใช้ HDFS (Hadoop Distributed File
System) ร่ วมกับ NoSQL
ระบบนาเข้าข้อมูล เมื่อถูกพัฒนาเรี ยบร้ อย จะสามารถนาเข้าข้อมูลจากแหล่งข้อมูลที่กาหนดไว้
โดยจะคัดกรองเฉพาะข้อมูลที่มีคา/วลีที่กาหนด และสามารถนาเข้าข้อมูลได้อย่างต่อเนื่ องเป็ นระยะเวลา
อย่างน้อย 1 เดือน และมีจานวนข้อความที่คาดหวังไว้อย่างน้อย 20,000 ข้อความที่ใช้ในการฝึ กการเรี ยนรู้
ของอัลกอริ ทึม

11.3 การสร้ างและทดสอบเครื่องมือ


จากรู ป ที่ 1 ผูว้ ิจยั ได้ออกแบบให้แหล่ ง เก็ บ ข้อมู ล ขนาดใหญ่ และโปรแกรมประมวลผลการ
วิ เ คราะห์ ข ้อ ความภาษาไทยท างาน Apache Hadoop ซึ่ งต้อ งการทรั พ ยากรในการประมวลผลคื อ
คอมพิ ว เตอร์ ส มรรถนะสู ง จ านวน 5 เครื่ อ ง สวิ ท ช์ ป ระสิ ท ธิ ภ าพสู ง 1 เครื่ อ ง และการเชื่ อ มต่ อ กับ
อินเตอร์เน็ต
คอมพิวเตอร์ สมรรถนะสู งทั้ง 5 เครื่ องแบ่งการทางานออกเป็ นดังนี้
- Primary และ Secondary NameNodes อย่างละ 1 เครื่ อง NameNode ทั้ง 2 เครื่ องนี้ใช้เพื่อเป็ นจุด
ควบคุมและกระจายการประมวลผล
- DataNode จานวน 3 เครื่ อง หน้าที่หลักของ DataNode มี 2 ส่ วนคือ ทาหน้าที่เก็บข้อมูล และทา
หน้าที่ในการประมวลผลแบบกระจาย ตามคาสั่งที่ได้จาก NameNode
สวิทช์ประสิ ทธิ ภาพสู งนามาใช้เพื่อให้คอมพิวเตอร์ ท้ งั 5 เครื่ องสามารถสื่ อสารกันได้ดว้ ยความ
รวดเร็ ว เนื่ องจากเป็ นการประมวลผลแบบกระจายที่ตอ้ งมีการสื่ อสารกันตลอดเวลาระหว่างคอมพิวเตอร์
ทั้ง 5 เครื่ อง
การเชื่ อมต่ออินเตอร์ เน็ตจาเป็ นต้องใช้เฉพาะกรณี ที่มีการนาเข้าข้อมูลจากแหล่งข้อมูลที่เป็ นสื่ อ
สังคมออนไลน์ และเฉพาะตอนติดตั้งระบบเท่านั้น
ในส่ วนโปรแกรมประมวลผลการวิเคราะห์ขอ้ ความภาษาไทย ผูว้ ิจยั จะพัฒนาโดยใช้ภาษาจาวา
ซึ่ งเข้ากันได้อย่างดีกบั กรอบงาน MapReduce/YARN โดยอัลกอริ ทึมที่จะพัฒนามีดงั นี้
- การจัดประเภทของข้อความ (Message Classification)
- การสกัดคาสาคัญ (Keyword Extraction)
7
- การวิเคราะห์อารมณ์ของข้อความ (Sentiment Analysis)
เนื่ องจากอัลกอริ ทึมเหล่านี้ ใช้กลไกการเรี ยนรู ้ ด้วยเครื่ องคอมพิวเตอร์ (Machine Learning) จึง
สามารถทดสอบความถู ก ต้องของอัล กอริ ทึ ม ที่ นาเสนอได้จ ากเครื่ องมื อมาตรฐาน เช่ น ค่ า ของ Log
Likelihood เป็ นต้น

12. ระยะเวลาทาการวิจัย
ระยะเวลาดาเนินการวิจยั 12 เดือน
13. สถานทีท่ าการทดลองและ/หรือเก็บข้ อมูล
ห้องปฏิบตั ิการคณะวิศวกรรมศาสตร์ มหาวิทยาลัยหอการค้าไทย
14. แผนการดาเนินงานตลอดโครงการ (โปรดระบุขั้นตอนโดยละเอียด) ในกรณีที่เป็ นโครงการร่ วมกันให้
ระบุการแบ่ งส่ วนงานและผู้รับผิดชอบ

ลำดับ เดือนที่
รำยละเอียด
ที่ 1 2 3 4 5 6 7 8 9 10 11 12
1 ออกแบบสถำปัตยกรรมทำงซอฟต์แวร์ ของ
ระบบ
2 จัดหำทรัพยำกรที่ตอ้ งใช้
3 พัฒนำระบบนำเข้ำข้อมูล
4 ออกแบบอัลกอริ ทึมกำรวิเครำะห์ขอ้ ควำม
5 พัฒนำโปรแกรมวิเครำะห์ขอ้ ควำม
6 ทดสอบกับข้อมูลจริ ง และปรับปรุ งอัลกอริ ทึม
7 สรุ ปและวิเครำะห์ผลกำรทดลองที่ได้จำก
ระบบจำลอง
8 เขียนบทควำมวิชำกำร ส่ งที่ประชุมวิชำกำร
ระดับนำนำชำติ
9 จัดทำรู ปเล่มของผลงำนในโครงกำรวิจยั ส่ ง
ต่อมหำวิทยำลัยหอกำรค้ำไทย

15. อุปกรณ์ การวิจัย


(1) อุปกรณ์ที่จาเป็ นในการวิจยั
 คอมพิวเตอร์สมรรถนะสู ง จานวน 5 เครื่ อง
 สวิทช์ประสิ ทธิภาพสู ง
(2) อุปกรณ์การวิจยั ที่มีอยูแ่ ล้ว
 การเชื่อมต่อกับอินเตอร์ เน็ต
8

16. งบประมาณในการวิจัย (ตามแบบ กสจ.003)


รายการ จานวนเงิน (บาท)
ก. หมวดค่ าตอบแทน
- ค่าตอบแทนนักวิจยั จานวน 1 คน เป็ นเวลา 12 เดือน 120,000
- ค่าจ้างผูช้ ่วยนักวิจยั จานวน 1 คน เป็ นเวลา 3 เดือน (300 บาท x 67 วัน) 20,100
รวม 130,100
ข. หมวดค่ าใช้ สอย
- ค่าใช้จ่ายในการเดินทางไปปฏิบตั ิงานเช่น ค่าน้ ามันและค่าทางด่วน 5,000
(เก็บข้อมูลและทดสอบผลศึกษาการวิจยั )
- ค่าวัสดุอุปกรณ์ คอมพิวเตอร์สมรรถนะสูง 5 เครื่ อง 300,000
- ค่าวัสดุอุปกรณ์ สวิทช์ประสิ ทธิภาพสูง 1 เครื่ อง 23,000
- ค่าจ้างสาเนาเข้าปกเย็บเล่มรายงานการวิจยั ฉบับสมบูรณ์ 1,000
รวม 324,000
ค. หมวดค่ าวัสดุ
- ค่าวัสดุสานักงาน (เช่น กระดาษไข กระดาษอัดสาเนา หมึกโรเนียว ฯลฯ) 700
- ค่าแผ่น CD จานวน 2 กล่องๆ ละ 150 บาท 300
- อื่น ๆ
รวม 1,000
ง. หมวดค่ าใช้ จ่ายอืน่ ๆ
-
รวม
ประมาณค่ าใช้ จ่ายรวมทั้งสิ้น 455,100

17. เอกสารอ้างอิง
[1] “Year-on-year audience growth of popular mobile social networks in the United States as
of July 2013”, http://www.statista.com/statistics/248066/year-on-year-audience-growth-of-
us-mobile-social-networks/ (Accessed 15/11/2015)
[2] David Jensen and Jennifer Neville, “Data Mining in Social Networks”, Dynamic Social
Network Modeling and Analysis: Workshop Summary and Papers, 2013.
[3] What is Big Data Analytics. [Online] http://www-
01.ibm.com/software/data/infosphere/hadoop/what-is-big-data-analytics.html (Accessed
14/11/2015)
[4] Apache Hadoop. [Online] http://hadoop.apache.org/ (Accessed 10/10/2015)
[5] Surapant Meknavin, Paisarn Charoenpornsawat, and Boonserm Kijsirikul, “Feature-based
Thai Word Segmentation”, In Proceedings of the Natural Language Processing Pacific
Rim Symposium 1997 (NLPRS’97), Phuket, Thailand, 1997.
9
[6] Choochart Haruechaiyasak, Sarawoot Kongyoung and Matthew N. Dailey, “A
Comparative Study on Thai Word Segmentation Approaches”, In Proceedings of ECTI-
CON, 2008.
[7] Kritsada Sriphaew, Hiroya Takamura and Manabu Okumura, “Sentiment Analysis for
Thai Natural Language Processing”, Proceedings of the 2nd Thailand-Japan International
Academic Conference, TJIA 2009, Kyoto, Japan, pp. 123-124, 2009.
[8] Waranya Wunnasri, Thanaruk Theeramunkong and Choochart Haruechaiyasak, “Solving
Unbalanced Data for Thai Sentiment Analysis”, in 10th International Joint Conference on
Computer Science and Software Engineering 2013 (JCSSE2013), 2013.

18. ชื่อวารสารทีค่ าดว่าจะนาผลงานวิจัยไปเผยแพร่


18.1 วารสารวิชาการ Chiang Mai Journal of Science
18.2 วารสารวิชาการ ECTI CIT
18.3 วารสารวิชาการ มหาวิทยาลัยหอการค้าไทย
18.2 การประชุมวิชาการ IEEE/ACM International Symposium on Big Data Computing

ลงชื่อ……………………………….….….
(ผูช้ ่วยศาสตราจารย์ ดร.ศุภฤกษ์ มานิตพรสุ ทธ์)
หัวหน้าโครงการวิจยั
……../……../……..

19. ความเห็นของคณบดี/ผู้บังคับบัญชา
………………………………………………………………………………………………………
………………………………………………………………………………………………………
……………………………………………………………………………………………..………..
………………………………………………………………………………………………………
………………………………………………………………………………………………………
………………………………………………………………………………………………………
………………………………………………………………………………………………………

ลงชื่อ……………………………….….……………
(รองศาสตราจารย์ ดร.วันชัย รัตนวงษ์)
คณบดีคณะวิศวกรรมศาสตร์
……../……../……..
10
แนวทางการเขียนข้ อเสนอโครงการวิจัย

1. ชื่อโครงการวิจยั ชื่อโครงการควรจะบ่งบอกให้ทราบถึงเนื้อหาสาระของการวิจยั ควรกาหนดให้ชดั เจนและ


กระชับที่สุดเท่าที่จะทาได้ การตั้งชื่อโครงการวิจยั อาจทาได้โดยการนาเอามิติต่าง ๆ ของการวิจยั มา
ประกอบกัน เช่น สาขาวิชาที่เกี่ยวข้อง ประเด็นหรื อตัวแปรที่เป็ นหัวใจของการศึกษา ลักษณะของการเก็บ
รวบรวมข้อมูล ประชากรเป้ าหมายหรื อสถานที่ที่ศึกษา ปี ที่ทาการศึกษา เป็ นต้น ซึ่ งการตั้งชื่ อโครงการวิจยั
ที่ชดั เจนและเหมาะสมนั้น ไม่จาเป็ นต้องใช้เพียงมิติเดียว แต่ก็มิได้หมายความว่าจะต้องนาเอาข้อมูลจากทุก
มิติมาเขียนไว้ในชื่อโครงการวิจยั ทั้งนี้แล้วแต่ความเหมาะสม
2. ประเภทของทุนวิจยั ให้ระบุวา่ เป็ นการขอทุนในระดับใดระหว่าง
1) ทุนนักวิจยั รุ่ นใหม่
2) นักวิจยั ที่มีประสบการณ์และเคยมีผลงานตีพิมพ์ในวารสารวิชาการระดับสถาบัน/ชาติ
3) นักวิจยั ที่มีประสบการณ์และเคยมีผลงานตีพิมพ์ในวารสารวิชาการระดับนานาชาติ
3. ประเภทของงานวิจยั ให้ระบุวา่ เป็ นงานวิจยั พื้นฐานหรื องานวิจยั ประยุกต์โดยมีหลักเกณฑ์ในการพิจารณา
ดังนี้
1.1 งานวิจยั พื้นฐาน (Basic research) เป็ นการวิจยั ที่มุ่งแสวงหาข้อเท็จจริ งเกี่ยวกับปรากฏการณ์อย่างมี
ระเบียบแบบแผน เพื่อนาไปใช้ทดสอบและ/หรื อสร้างทฤษฎีอธิ บายปรากฎการณ์น้ นั ๆ
2.2 งานวิจยั ประยุกต์ (Applied research) เป็ นการวิจยั ที่มุ่งแสวงหาความรู ้ใหม่ ๆ และมีวตั ถุประสงค์
เพื่อนาความรู ้น้ นั ไปใช้ประโยชน์ในการปฏิบตั ิอย่างใดอย่างหนึ่ง หรื อนาความรู ้และวิชาการต่าง ๆ ที่
ได้จากการวิจยั พื้นฐานมาประยุกต์ใช้อีกต่อหนึ่ง
4. คณะผู้ดาเนินการวิจยั ให้ระบุขอ้ มูลของผูว้ ิจยั และผูร้ ่ วมวิจยั (ถ้ามี) ให้ละเอียดและถูกต้อง ได้แก่ ชื่อ-
นามสกุล คุณวุฒิ ตาแหน่ง ประสบการณ์ดา้ นการวิจยั และผลงานวิจยั ที่เคยตีพิมพ์เผยแพร่
5. ความสาคัญและที่มาของปัญหาที่ทาการวิจัย บรรยายให้ทราบว่าจะทาการศึกษาเกี่ยวกับเรื่ องอะไร มี
ความสาคัญอย่างไร ศึกษาไปเพื่ออะไร เกี่ยวกับประชากรกลุ่มใด อะไรคือสาเหตุที่เป็ นตัวปัญหาและเป็ น
ผลที่เกิดขึ้น หรื อต้องการหาคาตอบเพื่อจะนามาช่วยแก้ปัญหาอะไรบ้าง นัน่ คือขอให้ผวู ้ ิจยั พยายามกล่าวถึง
ภูมิหลังและความสาคัญของปั ญหาและพยายามเขียนให้ผอู ้ ่านเกิดความสนใจในปัญหาที่ตอ้ งการศึกษาวิจยั
โดยเขียนให้มีความต่อเนื่องและเป็ นเหตุเป็ นผลซึ่ งกันและกัน
6. วัตถุประสงค์ ของการวิจยั วัตถุประสงค์ของการวิจยั เป็ นข้อความที่แสดงให้เห็นถึงสิ่ งที่ผวู ้ ิจยั ต้องการ
ทราบ ดังนั้นจึงควรระบุให้ชดั เจนว่าผูว้ ิจยั ต้องการศึกษาเกี่ยวกับอะไร ต้องการทราบหรื อต้องการจะ
บรรลุผลในเรื่ องใด และผลลัพธ์ที่คาดหวังคืออะไร ถ้ามีวตั ถุประสงค์หลายประการควรแบ่งออกเป็ นหัวข้อ
ต่าง ๆ ที่ชดั เจน (ไม่ซ้ าซ้อนหรื อคาบเกี่ยวกัน)
7. สมมติฐานของการวิจยั (ถ้ ามี) เป็ นขั้นตอนหนึ่งของกระบวนการวิจยั ที่ผวู ้ ิจยั ตั้งขึ้นเพื่อใช้เป็ นแนวทางใน
การค้นคว้าหาคาตอบโดยเฉพาะการทบทวนวรรณกรรมที่เกี่ยวข้อง เป็ นแนวทางในการสร้างเครื่ องมือวิจยั
และการเก็บข้อมูล รวมทั้งใช้เป็ นตัวกาหนดวิธีการและสถิติที่ใช้วิเคราะห์ขอ้ มูล ดังนั้นจึงขอให้ผวู ้ ิจยั ระบุ
ถึงข้อสันนิษฐานหรื อความคาดเดาถึงผล หรื อคาตอบของการวิจยั ที่ จะเกิดขึ้นว่าเป็ นอย่างไร
11
8. ขอบเขตของการวิจยั ให้ระบุว่าการวิจยั ตามโครงการที่เสนอนี้มีขอบเขตแค่ไหนครอบคลุมถึงอะไรบ้าง
การกาหนดขอบเขตของการวิจยั ควรกาหนดไว้ท้ งั ในแง่ของประชากร และกลุ่มตัวอย่าง ตัวแปรที่ศึกษา
ประเด็นที่ศึกษา พื้นที่ที่ทาการศึกษา เป็ นต้น ซึ่ งเป็ นการตีกรอบไว้วา่ ผูว้ ิจยั จะศึกษาภายในขอบเขตที่
กาหนดนี้เท่านั้น การกาหนดขอบเขตของการวิจยั จะช่วยให้ผวู ้ ิจยั กาหนดขนาดของกลุ่มตัวอย่างและวิธีการ
สุ่ มกลุ่มตัวอย่างได้เหมาะสมยิ่งขึ้น เกิดความสะดวกในการวางแผนรวบรวมข้อมูลและช่วยให้รู้วา่ การ
สรุ ปผลของการวิจยั จะอ้างอิงไปได้กว้างขวางเพียงใด
9. ประโยชน์ ที่คาดว่ าจะได้ รับ ให้ระบุความคาดหมายของประโยชน์ที่จะได้รับจากโครงการวิจยั นี้วา่ จะมีผล
ต่อการพัฒนาในเรื่ องใดและอย่างไรบ้าง ซึ่ งประโยชน์ที่เกิดขึ้นอาจจะมีท้ งั ในด้านวิชาการและด้านการ
ปฏิบตั ิ การเขียนหัวข้อนี้อาจจะเขียนเป็ นเชิงบรรยาย หรื อเขียนเป็ นข้อ ๆ ก็ได้
10. เอกสารและผลงานวิจยั ที่เกีย่ วข้ อง ส่ วนนี้ควรกล่าวถึงแนวคิดทฤษฎีและ/หรื อผลงานวิจยั ที่เกี่ยวข้องกับ
เรื่ องที่จะศึกษาวิจยั ซึ่ งมีวตั ถุประสงค์เพื่อชี้ให้เห็นว่างานวิจยั ในเรื่ องนี้ที่ทากันมาแล้ว ทาในด้านใดบ้าง ใช้
วิธีการศึกษาอย่างไร โครงการวิจยั นี้จะเพิ่มเติมความรู ้ในส่ วนใดของเรื่ อง การเขียนในหัวข้อนี้ควรเขียน
อย่างย่อ ๆ และเลือกสรรแต่ในส่ วนที่สาคัญเท่านั้น เอกสารหรื อผลงานวิจยั ที่นามาอ้างอิงควรเป็ นเอกสาร
ใหม่หรื อเป็ นปัจจุบนั มากที่สุด ซึ่ งจะมีเนื้อหาสาระที่ทนั สมัยมากกว่า การทบทวนเอกสารและผลงานวิจยั
นี้ จะช่วยให้ผพู ้ ิจารณาโครงการวิจยั เกิดความกระจ่างว่าในวงวิชาการยังมีส่วนใดบ้างที่ไม่สมบูรณ์ หรื อยัง
เป็ นที่น่าสงสัย จนทาให้ผวู ้ ิจยั ต้องเสนอโครงการวิจยั ขึ้นมาเพื่อมุ่งเติมส่ วนที่ขาดหายไป หรื อหาความ
กระจ่างให้กบั ปัญหาที่เป็ นข้อสงสัยนั้น
11. ระเบียบวิธีวจิ ยั ให้บรรยายถึงการดาเนินการวิจยั ในส่ วนที่เกี่ยวกับประเด็นต่อไปนี้
11.1 ประชากรและกลุ่มตัวอย่าง ให้ระบุวา่ ประชากรที่ผวู ้ ิจยั ต้องการศึกษาคือใคร (หรื ออะไร) มี
ลักษณะอย่างไร มีจานวนเท่าไร และวิธีการที่จะได้มาซึ่ งกลุ่มตัวอย่างเป็ นอย่างไร ในกรณี ของ
การศึกษาเชิงปริ มาณ สิ่ งที่ผวู ้ ิจยั ควรคานึงถึงก็คือความเพียงพอของขนาดตัวอย่าง และความเป็ น
ตัวแทนของประชากร ทั้งนี้เพื่อเพิ่มความถูกต้องเหมาะสมในการอ้างอิงผลสรุ ปจากกลุ่มตัวอย่าง
ไปยังประชากรที่ศึกษา
11.2 เครื่ องมือที่ใช้ในการวิจยั ระบุให้ชดั เจนว่าผูว้ ิจยั จะใช้เครื่ องมือประเภทใด หรื ออะไรบ้าง ในการ
เก็บรวบรวมข้อมูลที่ตอ้ งการจากกลุ่มตัวอย่าง ซึ่ งเครื่ องมือที่จะนามาใช้น้ ีอาจเป็ นเครื่ องมือที่
ผูว้ ิจยั พัฒนาขึ้นเอง หรื อเป็ นเครื่ องมือที่มีผอู ้ ื่นสร้างหรื อพัฒนาไว้ก่อนแล้วก็ได้ (ในกรณี ที่ใช้
เครื่ องมือการวิจยั อันเป็ นผลงานของผูอ้ ื่นควรอ้างอิงแหล่งที่มาและคุณภาพของเครื่ องมือด้วย)
11.3 วิธีการเก็บรวบรวมข้อมูล ให้ระบุวา่ ผูว้ ิจยั มีข้ นั ตอนและวิธีการเก็บรวบรวมข้อมูลอย่างไร เมื่อไร
ใครเป็ นผูด้ าเนินการ มีวิธีการควบคุมสภาพแวดล้อม หรื อตัวแปรแทรกซ้อนที่อาจมีผลต่อคุณภาพ
ของข้อมูลหรื อไม่อย่างไร
11.4 การวิเคราะห์ขอ้ มูล การวิเคราะห์ขอ้ มูลเป็ นการจัดกระทากับข้อมูลดิบที่เก็บรวบรวมมาได้ เพื่อ
หาทางที่จะตอบปั ญหา วัตถุประสงค์ หรื อทดสอบสมมุติฐานของการวิจยั ในประเด็นนี้ให้ระบุ
วิธีการทางสถิติท้ งั หมดที่จะนามาใช้ในการวิเคราะห์ขอ้ มูล แต่ไม่จาเป็ นต้องอธิ บายรายละเอียด
ของกระบวนการทางสถิติน้ นั ๆ
12. ระยะเวลาทาการวิจยั ให้ระบุระยะเวลารวมตั้งแต่เริ่ มต้นจนสิ้ นสุ ดโครงการ ว่าจะใช้ระยะเวลาดาเนินการกี่
ปี กี่เดือน
12
13. สถานที่ทาการทดลองและ/หรือเก็บข้ อมูล ให้ระบุสถานที่ที่จะทาการเก็บรวบรวบข้อมูล หรื อทาการ
ทดลองให้ชดั เจน
14. แผนการดาเนินงานวิจัยตลอดโครงการ จากระยะเวลารวมในข้อ 12 ให้ผวู ้ ิจยั แสดงตารางที่ระบุถึงรายการ
ของงานหรื อกิจกรรม โดยระบุวา่ ในแต่ละขั้นของการดาเนินการวิจยั นั้น จะดาเนิ นการในช่วงเวลาใดและ
ใช้เวลานานเท่าไร การวางแผนตารางเวลานี้ ควรกะประมาณให้สมจริ ง และควรคานึงถึงความเป็ นไปได้ใน
ด้านอื่น ๆ ประกอบด้วย
15. อุปกรณ์ การวิจยั (ถ้ามี) ให้ระบุรายการอุปกรณ์ท้ งั หมดที่จาเป็ นต้องใช้ในการวิจยั และอุปกรณ์การวิจยั ที่มี
อยูแ่ ล้ว
16. งบประมาณในการวิจัย ให้ระบุรายละเอียดประมาณการค่าใช้จ่ายรวมทั้งหมดของโครงการพร้อมทั้งแจก
แจงยอดรวมของค่าใช้จ่ายแยกตามประเภทหมวดเงินงบประมาณ ได้แก่ หมวดค่าตอบแทน หมวดค่าใช้
สอย และหมวดค่าวัสดุ สาหรับรายละเอียดของการประมาณค่าใช้จ่ายนั้น ให้คานวณและแจกแจง
รายละเอียดตามแนวทางประมาณการค่าใช้จ่าย (ตามแบบฟอร์ม กสจ.003)
17. เอกสารอ้ างอิง ให้ระบุรายการหนังสื อและเอกสารอ้างอิงทุกเล่มที่นามาอ้างถึงในโครงการวิจยั นี้โดยใช้
รู ปแบบการเขียนบรรณานุกรมตามที่งานส่ งเสริ มการวิจยั มหาวิทยาลัยหอการค้าไทยกาหนด สาหรับ
หนังสื อหรื อเอกสารอื่นๆที่ยงั ไม่ได้นามาอ้างอิง ไม่ควรจะระบุมาเพราะจะทาให้เอกสารอ้างอิงยาวเกิน
ความจาเป็ น
18. ชื่อวารสารและ/หรือชื่อการประชุมที่คาดว่ าจะนาผลงานวิจยั ไปเผยแพร่ ให้ระบุชื่อวารสารและ/หรื อชื่อ
การประชุมที่ผวู ้ ิจยั คาดว่าจะนาผลงานวิจยั ที่ได้รับจากการวิจยั ครั้งนี้ไปเผยแพร่ โดยต้องแสดงหลักฐานว่า
วารสารและ/หรื อการประชุมนั้น ๆ อยูใ่ นระดับสถาบัน/ชาติ/นานาชาติ เพื่อประโยชน์ต่อผูว้ ิจยั ในการขอรับ
รางวัลการตีพิมพ์และ/หรื อการนาเสนอผลงาน
19. ความเห็นของคณบดี/ผู้บังคับบัญชา ให้คณบดีหรื อผูบ้ งั คับบัญชาลงความเห็นประกอบการพิจารณาว่า
โครงการวิจยั ที่เสนอนี้มีความจาเป็ นหรื อมีความสาคัญอย่างไร พร้อมทั้งให้ความเห็นชอบหรื ออนุมตั ิให้ใช้
อุปกรณ์และสถานที่ในการดาเนินการวิจยั ได้
20. ลายมือชื่อผู้วจิ ัยและที่ปรึกษาโครงการ ให้หวั หน้าโครงการวิจยั และที่ปรึ กษาโครงการ(ถ้ามี) ลงลายมือชื่อ
ไว้เป็ นหลักฐาน

You might also like