DALL-E คืออะไร? รู้จักระบบ AI ที่วาดภาพได้เพียงแค่ป้อนคำสั่ง

ปฏิเสธไม่ได้เลยว่าการเปิดตัวของ ChatGPT ในปี 2022 ปฏิวัติวงการแชตบอตไปทั่วโลก ดังจะเห็นได้จากการที่ระบบ AI ตัวนี้เพิ่งเปิดตัวได้ไม่นาน ก็มียอดผู้ใช้งานต่อเดือนทะลุกว่า 616 ล้านคนไปแล้ว!

แต่ไม่ได้มีแค่ ChatGPT ที่ได้รับความนิยมไปทั่วโลกเท่านั้น เพราะในช่วงก่อนหน้าในปีเดียวกันได้มีการเปิดตัวระบบ AI สำหรับสร้างงานศิลปะเสมือนจริงตามรูปแบบคำสั่งอิสระ หรือที่เรียกว่า DALL-E ด้วยเช่นกัน ซึ่งเจ้าระบบ AI ตัวนี้ ได้ถูกนำไปใช้งานอย่างแพร่หลาย รวมถึงถูกนำไปใช้เพื่อสร้างผลลัพธ์ทางการตลาดให้มีประสิทธิภาพมากกว่าเดิมอีกด้วย

หากใครอยากรู้ว่า DALL-E คืออะไร และเจ้า AI ตัวนี้มีหลักการทำงานอย่างไรบ้าง เรารวบรวมทุกสิ่งที่ควรรู้มาให้คุณแล้วในบทความนี้!

 

ทำความรู้จักระบบ DALL-E คืออะไร? 

ในช่วงเดือนเมษายนปี 2022 หลายคนอาจจะเคยเห็นเพจดังในโซเชียลมีเดียต่างก็แชร์ภาพวาดสไตล์เสมือนจริงกันอย่างแพร่หลาย โดยภาพเหล่านี้ก็มักจะมีข้อความที่เขียนกำกับไว้ด้วยว่า “DALL-E Mini”

ซึ่งภาพเหล่านี้ แท้จริงแล้วเกิดขึ้นจากการใช้ระบบ AI ที่มีชื่อว่า DALL-E สร้างขึ้นมา ซึ่ง DALL-E คือโปรแกรม AI สำหรับสร้างรูปภาพจากการป้อนคำสั่งข้อความ โดยเจ้า AI ตัวนี้จะใช้เทคนิคการประมวลผลภาษาธรรมชาติและทำการสร้างสรรค์ภาพมาผสมผสานเข้าด้วยกัน จนสามารถสร้างภาพออกมาได้อย่างสมจริง โดยผู้ใช้งานสามารถป้อนคำสั่งอะไรก็ได้ จากนั้นระบบนี้จะทำการประมวลคำสั่ง และสร้างภาพเสมือนจริงออกมาให้ ซึ่งโดยทั่วไปแล้วจะสร้างภาพมาให้ทั้งหมดประมาณ 9 ภาพ ตัวอย่างเช่น หากเราป้อนคำสั่งด้วยข้อความเพื่อให้ DALL-E สร้างภาพสุนัขบินเหนือตึกสูง ภาพที่ได้ออกมาก็จะเป็นภาพตามข้อความนั้น ๆ โดยที่เราไม่จำเป็นต้องวาดเอง

โดย DALL-E คือ AI ที่พัฒนาขึ้นโดย OpenAI หรือบริษัทเดียวกับที่สร้าง ChatGPT โดยเปิดตัวเวอร์ชันแรกไปเมื่อต้นปี 2021 และปัจจุบันอยู่ในเวอร์ชันที่ 2 โดยชื่อ DALL-E นี้ มีที่มาจากการนำชื่อนักวาดภาพแนวเหนือจริงอย่าง ‘ซัลวาดอร์ ดาลี’ (Salvador Dalí) มาผสมกับหุ่นยนต์ในภาพยนตร์ของดิสนีย์ที่ชื่อว่า ‘WALL-E’ จนออกมาเป็นชื่อ DALL-E อย่างที่เราเห็นกัน

 

DALL-E มีความเป็นมาอย่างไร?

จุดเริ่มต้นของปัญญาประดิษฐ์วาดภาพ DALL-E เกี่ยวข้องโดยตรงกับ GPT-3 (3rd Generation Generative Pre-trained Transformer) ซึ่งเป็นปัญญาประดิษฐ์อันโด่งดังอีกหนึ่งชิ้นจากทีมงาน OpenAI โดย GPT-3 เปิดตัวในช่วงเดือนมิถุนายน ปี 2020 เป็นระบบที่มีจำนวนพารามิเตอร์มากถึง 1.75 แสนล้านตัว ถือได้ว่าเป็นโมเดลทางภาษาที่ใหญ่และซับซ้อนที่สุดตัวหนึ่งในโลก โดยเจ้าระบบตัวนี้สามารถเข้าใจภาษาที่มนุษย์ป้อนเข้าไป และยังสามารถสร้างบทสนทนาโต้ตอบกลับได้อย่างเป็นธรรมชาติ

ด้วยความสามารถที่กล่าวไป ในปีเดียวกัน ทางทีมงาน OpenAI เลยได้ต่อยอดการใช้ระบบนี้ให้กลายเป็นโมเดลที่ชื่อว่า Image GPT พร้อมกันนั้นยังเกิดแรงบันดาลใจที่จะใช้ภาษาที่มนุษย์ป้อนเข้าไป มาสร้างหรือปรับเปลี่ยนรูปภาพ จนก่อกำเนิดเป็น DALL-E เวอร์ชันแรกเมื่อเดือนมกราคม ปี 2021 ภายใต้จำนวนพารามิเตอร์กว่า 1.2 หมื่นล้านตัว 

ซึ่งความโดดเด่นของระบบ DALL-E จะอยู่ที่ความสามารถในการสร้างรูปภาพตามข้อความที่มนุษย์ป้อนเข้าไปทันที แล้วยังมีความเข้าใจองค์ประกอบของรูปภาพในแง่ต่าง ๆ เช่น สไตล์และเทคนิคการวาดภาพ อย่างไรก็ดี DALL-E เวอร์ชันแรกก็ยังมีข้อจำกัดเรื่องความละเอียดและสมจริงของภาพอยู่ ด้วยเหตุนี้ทาง OpenAI จึงได้พัฒนาเพิ่มเติม จนในที่สุดได้เปิดตัว DALL-E เวอร์ชันที่ 2 ในปี 2022 หรือเวอร์ชันล่าสุดที่ใช้กันอยู่ในปัจจุบันซึ่งมีความเสมือนจริงมากยิ่งขึ้น

 

วิธีการใช้งาน DALL-E 2 ไม่ยากอย่างที่คิด

แม้จะขึ้นชื่อว่าเป็นระบบปัญญาประดิษฐ์วาดภาพ แต่ DALL-E ไม่ได้ใช้งานยากอย่างที่คิด โดยสามารถเริ่มต้นใช้งานได้ตามขั้นตอนดังต่อไปนี้

ขั้นตอนที่ 1

ผู้ใช้สามารถเข้าไปที่เว็บไซต์ของ DALL-E 2 จากนั้นคลิกที่ Sign Up เพื่อสร้างบัญชีผู้ใช้งาน โดยหากต้องการเชื่อมต่อกับบัญชีที่มีอยู่แล้วก็สามารถเชื่อมต่อกับบัญชีที่สมัครผ่านทาง Google หรือ Microsoft ได้เลย 

ขั้นตอนที่ 2

เมื่อขั้นตอนการสมัครบัญชีเสร็จสมบูรณ์ ทางเว็บไซต์ของ DALL-E ก็จะส่งข้อความต้อนรับการเข้าใช้งานพร้อมทั้งสรุปกฎเกณฑ์และข้อบังคับที่สามารถทำได้ในโปรแกรมนี้ เมื่ออ่านข้อกำหนดทั้งหมดเสร็จสิ้น ก็สามารถกดปุ่ม Continue หรือปุ่มดำเนินการต่อ เพื่อเข้าสู่ในขั้นตอนต่อไป

ขั้นตอนที่ 3

ต่อไปจะเป็นขั้นตอนของการที่เว็บไซต์ของ DALL-E แนะนำเกี่ยวกับระบบเครดิตให้ผู้ใช้งานได้รู้อย่างคร่าว ๆ โดยเนื้อหาจะพูดถึงการที่โปรแกรมของ DALL-E นั้นจะไม่ได้ใช้บริการฟรีทั้งหมด แต่จะมีระบบ “เครดิต” ที่จำกัดจำนวนครั้งสำหรับการใช้โปรแกรมได้ฟรี ซึ่งโดยทั่วไปผู้ใช้งานจะได้รับ 50 เครดิตฟรี และเมื่อสมัครบัญชีจะได้เพิ่มอีก 15 เครดิตฟรีต่อเดือน โดยแต่ละเครดิตหมายถึงการใช้งานได้ฟรี 1 ครั้ง ซึ่งหมายความว่าชุดภาพแต่ละชุดที่สร้างโดยใช้โปรแกรมนี้จะมีค่าใช้จ่าย 1 เครดิต โดยผู้ใช้งานจะสามารถสร้างรูปภาพใหม่ได้ 4 ภาพต่อ 1 ครั้ง อย่างไรก็ดี หากใช้เครดิตฟรีหมด ก็สามารถซื้อเพิ่มได้ตามค่าใช้จ่ายที่กำหนด

ขั้นตอนที่ 4

เมื่อเริ่มต้นใช้งาน บริเวณหน้าจอหลักจะมีหลายตัวเลือกให้ลองใช้ ยกตัวอย่างเช่น หากกดปุ่ม Surprise me โปรแกรมก็จะสร้างคำอธิบายอัตโนมัติเพื่อสาธิตวิธีการป้อนคำสั่งและเรียบเรียงคำพูด พร้อมกันนั้น ผู้ใช้งานยังสามารถอัปโหลดรูปภาพที่มีอยู่และใช้โปรแกรมแก้ไขตามความต้องการ และที่สำคัญ หากต้องการให้ DALL-E ช่วยวาดภาพ ก็สามารถป้อนคำอธิบายเพื่อสร้างภาพใหม่ โดยทางระบบอนุญาตให้ป้อนได้สูงสุดได้ถึง 400 ตัวอักษร อีกทั้งยังสามารถกดเลือกเมนูปรับแต่งเพิ่มเติม เช่น ดิจิทัลอาร์ต ภาพบุคคล ภาพเรนเดอร์สามมิติ หรือแม้แต่ภาพร่าง โดยโปรแกรมจะสร้างออกมาทั้งหมด 4 ภาพต่อการป้อนคำสั่ง 1 ครั้ง โดยแต่ละภาพก็จะมีสไตล์ที่แตกต่างกันไป

ขั้นตอนที่ 5

หลังจากป้อนคำสั่งและได้ภาพที่ต้องการทั้งหมด 4 ภาพแล้ว ก็สามารถแก้ไขรูปภาพด้วยฟีเจอร์พื้นฐานต่าง ๆ เพิ่มเติม เช่น เพิ่มเส้นขอบ ลบองค์ประกอบบางอย่าง หรือแม้แต่ป้อนคำสั่งให้ระบบของ DALL-E สร้างรูปแบบที่ต่างออกไปจากรูปภาพนั้นก็ได้

 

แล้วปัญญาประดิษฐ์วาดภาพ DALL-E มีข้อดีข้อเสียอย่างไร?

ข้อดีของ DALL-E ที่เห็นได้อย่างชัดเจน แน่นอนว่าก็คือการช่วยทุ่นแรงการสร้างสรรค์รูปภาพ โดยที่คุณไม่จำเป็นต้องลงทุนลงแรงวาดขึ้นมาตั้งแต่ต้น ช่วยให้คุณสร้างภาพขึ้นได้ง่าย โดยไม่จำเป็นต้องใช้เครื่องมือแก้ไขภาพที่ซับซ้อน พร้อมกันนั้น ผู้ใช้งานอินเทอร์เน็ตในแวดวงต่าง ๆ ที่ไม่ได้มีความสามารถหรือเซนส์ทางศิลปะโดยตรงก็จะมั่นใจได้ว่า มีตัวช่วยที่สามารถแก้ไขข้อจำกัดตรงนี้ได้

อย่างไรก็ดี DALL-E ก็มีข้อจำกัดด้วยเหมือนกัน เพราะถึงแม้จะเป็นเวอร์ชันที่สองที่เปิดตัวออกมาแล้ว แต่ระบบ AI ตัวนี้ก็ยังอยู่ในช่วงเริ่มต้นการใช้งาน ทำให้นักสร้างสรรค์อาจไม่สามารถพึ่งพาเจ้า AI ได้ 100% แต่ปัญหาหลัก ๆ จะอยู่ที่การป้อนคำสั่ง เนื่องจากภาษามนุษย์ที่ใช้กันบนโลกตอนนี้ค่อนข้างซับซ้อน กำกวม แล้วที่สำคัญ คำ ๆ หนึ่งยังสามารถแปลหมายความได้หลายแบบ ยกตัวอย่างเช่น การป้อนคำสั่งให้โปรแกรมสร้างรูปภาพ “กรินเดลวัลด์” ซึ่งคำนี้หมายความได้ทั้ง ตัวละครหลักในภาพยนตร์จักรวาลของแฮรี่พอตเตอร์ และยังหมายถึงหมู่บ้านเล็ก ๆ ในหุบเขาของสวิตเซอร์แลนด์ ทำให้ระบบ AI อาจยังไม่สามารถเลือกสร้างภาพได้ตรงใจ จนกว่าผู้ใช้งานจะลงรายละเอียดอย่างเหมาะสม

 

สรุป

แม้ปัญญาประดิษฐ์วาดภาพอย่าง DALL-E จะมีข้อจำกัด เช่น การที่ไม่สามารถมอบผลลัพธ์ได้ตรงใจผู้ใช้งาน 100% แต่เทคโนโลยีตัวนี้ก็ได้รับการพูดถึงเป็นเสียงเดียวกันว่าสามารถช่วยอำนวยความสะดวก ทุ่นแรง รวมถึงเป็นฟีเจอร์สนุก ๆ ที่คุ้มค่าแก่การนำมาพัฒนาการทำธุรกิจเพื่อให้ได้ผลลัพธ์ที่ดีขึ้นได้ ดังนั้น ผู้ประกอบการทุกคนจึงควรทำความรู้จักระบบ AI ตัวนี้เอาไว้ เพื่อที่จะสามารถนำมาปรับใช้สำหรับการพัฒนาแผนธุรกิจในโลกแห่งเทคโนโลยีได้อย่างมีประสิทธิภาพสูงสุด

แต่หากผู้ประกอบการท่านใด ยังไม่รู้ว่าจะนำเทคโนโลยี AI ต่าง ๆ มาช่วยพัฒนาแผนธุรกิจอย่างไร ก็สามารถติดต่อมายัง Primal Digital Agency ของเราได้เลย เรามีผู้เชี่ยวชาญที่พร้อมช่วยให้ธุรกิจของคุณพัฒนาขึ้นไปอีกขั้น ถ้าพร้อมแล้วก็กรอกแผนการตลาดเพื่อปรึกษากับเราฟรีตอนนี้ได้เลย!