GPT-5 สามารถรับมือกับปัญหาสุขภาพจิตได้แล้วหรือยัง? ข่าวสารล่าสุด!

ในการอัปเดตเดือนตุลาคม OpenAI รายงานว่าประมาณ 0.15% ของผู้ใช้งานรายสัปดาห์ มีการสนทนาที่มีตัวบ่งชี้ที่ชัดเจนของการวางแผนหรือเจตนาฆ่าตัวตายที่อาจเกิดขึ้น — ส่วนแบ่งที่เมื่อปรับขนาดตามฐานผู้ใช้ขนาดใหญ่ของ ChatGPT จะสอดคล้องกับ มากกว่าหนึ่งล้านคนในแต่ละสัปดาห์ การพูดคุยหัวข้อที่เกี่ยวข้องกับการฆ่าตัวตายกับบริการได้เปิดความสนใจไปที่คำถามที่น่ากังวล: โมเดลภาษาขนาดใหญ่สามารถตอบสนองได้อย่างมีนัยสำคัญและปลอดภัยหรือไม่ เมื่อผู้คนนำปัญหาสุขภาพจิตที่ร้ายแรง เช่น โรคจิต โรคคลั่งไคล้ เจตนาฆ่าตัวตาย และการพึ่งพาทางอารมณ์อย่างลึกซึ้ง เข้ามาในการสนทนา

ดังนั้นการอัปเดต GPT-5 ของ OpenAI ในเดือนตุลาคมจึงเริ่มดำเนินการผลิตแล้ว gpt-5-oct-3 อัปเดต — แสดงให้เห็นถึงความพยายามอย่างชัดเจนและรอบคอบที่สุดของบริษัทในการทำให้แบบจำลองภาษาขนาดใหญ่ (LLM) ปลอดภัยและมีประโยชน์มากขึ้นเมื่อผู้ใช้แจ้งปัญหาสุขภาพจิต การเปลี่ยนแปลงเหล่านี้ไม่ใช่การแก้ไขแบบวิเศษเพียงครั้งเดียว แต่เป็นชุดการดำเนินการทางเทคนิค กระบวนการ และการประเมินผลที่มุ่งลดผลลัพธ์ที่เป็นอันตรายหรือไม่เป็นประโยชน์ ลดทรัพยากรวิชาชีพ และป้องกันไม่ให้ผู้ใช้พึ่งพาแบบจำลองนี้แทนการรักษาทางคลินิก แต่ในทางปฏิบัติระบบดีขึ้นมากเพียงใด มีอะไรที่เปลี่ยนแปลงไปบ้าง และความเสี่ยงที่เหลืออยู่คืออะไร

OpenAI อัปเดตใน gpt-5 เกี่ยวกับอะไร และเหตุใดจึงสำคัญ?

OpenAI ได้ปรับใช้การอัปเดตโมเดล GPT-5 เริ่มต้นของ ChatGPT (โดยทั่วไปอ้างอิงในการสื่อสารเป็น gpt-5-oct-3) มีจุดมุ่งหมายเพื่อเสริมสร้างพฤติกรรมของแบบจำลองโดยเฉพาะ การสนทนาที่ละเอียดอ่อน — ภาวะที่รวมถึงสัญญาณของโรคจิตหรืออาการคลั่งไคล้ ความคิดหรือการวางแผนฆ่าตัวตาย หรือการพึ่งพาทางอารมณ์ต่อ AI ที่สามารถแทนที่ความสัมพันธ์ในโลกแห่งความเป็นจริงได้

การเปลี่ยนแปลงดังกล่าวได้รับแจ้งจากการปรึกษาหารือกับผู้เชี่ยวชาญด้านสุขภาพจิตมากกว่า 170 ราย และจากอนุกรมวิธานภายในใหม่และการประเมินอัตโนมัติที่ออกแบบตาม "พฤติกรรมที่ต้องการ" ที่เป็นรูปธรรม หลังจากได้รับการปรับปรุงโดยผู้เชี่ยวชาญด้านจิตวิทยา โมเดล GPT-5:

ในชุดความท้าทายด้านสุขภาพจิตแบบกำหนดเป้าหมาย โมเดล GPT-5 ใหม่ได้รับคะแนน ~% 92 สอดคล้องกับอนุกรมวิธานพฤติกรรมที่บริษัทต้องการ (เทียบกับเปอร์เซ็นต์ที่ต่ำกว่ามากสำหรับเวอร์ชันก่อนหน้าในชุดทดสอบที่ยาก)
สำหรับสถานการณ์การทำร้ายตัวเองและการฆ่าตัวตาย การประเมินอัตโนมัติเพิ่มขึ้นเป็น ~% 91 การปฏิบัติตามจาก 77% เกี่ยวกับ GPT-5 รุ่นก่อนหน้าในเกณฑ์มาตรฐานเฉพาะที่อธิบายไว้ OpenAI ยังรายงานด้วย ~% 65 การลดอัตราการตอบสนองที่ "ไม่เป็นไปตามข้อกำหนดอย่างสมบูรณ์" ในหลายโดเมนด้านสุขภาพจิตในปริมาณการผลิต
มีการรายงานการปรับปรุงในการสนทนาที่ยาว ขัดแย้ง หรือยืดเยื้อ (ซึ่งเป็นโหมดความล้มเหลวที่ทราบกันดีสำหรับโมเดลการแชท) ซึ่งบริษัทระบุว่าการอัปเดตในเดือนตุลาคมจะรักษาความสม่ำเสมอและความปลอดภัยที่สูงขึ้นในการสนทนาที่ขยายออกไป

GPT-5 สามารถรับมือกับปัญหาสุขภาพจิตได้แล้วหรือยัง? ข่าวสารล่าสุด!

ทำไมมันถึงสำคัญ

OpenAI กล่าวว่า — เมื่อพิจารณาจากขนาดปัจจุบันของ ChatGPT — แม้แต่บทสนทนาที่ละเอียดอ่อนในสัดส่วนที่น้อยมากก็อาจเทียบได้กับจำนวนผู้คนจำนวนมาก บริษัทรายงานว่าในหนึ่งสัปดาห์โดยทั่วไป:

เกี่ยวกับ 0.07% ของผู้ใช้ที่ใช้งานอยู่แสดงอาการที่เป็นไปได้ที่สอดคล้องกับอาการทางจิตหรืออาการคลั่งไคล้ และ
เกี่ยวกับ 0.15% ของผู้ใช้ที่ใช้งานอยู่มีการสนทนาที่มีตัวบ่งชี้ที่ชัดเจนของการวางแผนหรือเจตนาฆ่าตัวตายที่อาจเกิดขึ้น และ
ลวก 0.15% ของผู้ใช้ที่ใช้งานอยู่มี "ระดับที่เพิ่มขึ้น" ของความผูกพันทางอารมณ์กับ ChatGPT

เพื่อทำให้เปอร์เซ็นต์เหล่านี้เป็นรูปธรรม: CEO ของ OpenAI กล่าวว่า ChatGPT มี ~ผู้ใช้งาน 800 ล้านคนต่อสัปดาห์การคูณจะให้ผลเป็นจำนวนผู้ใช้ที่แน่นอน:

Psychosis/mania: 800,000,000 × 0.0007 = 560,000 people/week
Suicidal planning/intent: 800,000,000 × 0.0015 = 1,200,000 people/week
Emotional reliance: 800,000,000 × 0.0015 = 1,200,000 people/week

หมวดหมู่มีเสียงดังและทับซ้อนกัน (การสนทนาเดียวอาจปรากฏในหมวดหมู่มากกว่าหนึ่งหมวดหมู่) และสิ่งเหล่านี้คือ ประมาณการ ได้มาจากอนุกรมวิธานการตรวจจับภายในมากกว่าการวินิจฉัยทางคลินิก

OpenAI นำการเปลี่ยนแปลงเหล่านี้ไปใช้ได้อย่างไร — กลไกการปรับปรุง 5 ขั้นตอน?

OpenAI อธิบายกระบวนการแบบหลายแง่มุมที่ผู้เชี่ยวชาญเป็นผู้ให้ข้อมูล ด้านล่างนี้คือกระบวนการที่สรุปและทำซ้ำได้ กลไกการปรับปรุงห้าขั้นตอน ที่สอดคล้องกับการเปิดเผยข้อมูลของบริษัทและแนวทางปฏิบัติทั่วไปในวิศวกรรมความปลอดภัยแบบจำลอง

กลไกการปรับปรุงห้าขั้นตอน

การจัดหมวดหมู่และการติดฉลากโดยผู้เชี่ยวชาญ เรียกจิตแพทย์ นักจิตวิทยา และแพทย์ผู้ดูแลเบื้องต้นมาประชุมเพื่อกำหนดพฤติกรรมและภาษาที่บ่งบอกถึงโรคจิต/อาการคลั่งไคล้ เจตนาทำร้ายตัวเอง หรือการพึ่งพาทางอารมณ์ที่ไม่ดีต่อสุขภาพ สร้างชุดข้อมูลที่มีป้ายกำกับและกฎการตัดสิน
การรวบรวมข้อมูลที่กำหนดเป้าหมายและคำแนะนำที่คัดสรรมา รวบรวมตัวอย่างบทสนทนาที่เป็นตัวแทน ตัวอย่างกรณีที่ไม่ชัดเจน และอินพุตที่เป็นปฏิปักษ์ เสริมด้วยบทถอดความการเล่นตามบทบาทที่ได้รับการควบคุมซึ่งสร้างขึ้นภายใต้การดูแลของแพทย์
การปรับแต่งโมเดล / ปรับแต่งอย่างละเอียดด้วยวัตถุประสงค์ด้านความปลอดภัย ฝึกฝนหรือปรับแต่งโมเดลพื้นฐานบนชุดข้อมูลที่มีการดูแลด้วยเงื่อนไขการสูญเสียที่ลงโทษการเสริมแรงของความเข้าใจผิด จัดเตรียมเทมเพลตการตอบสนองที่ปลอดภัย และส่งเสริมการกำหนดเส้นทางไปยังทรัพยากรวิกฤต
ชั้นจำแนก + ชั้นราวกั้น (ความปลอดภัยขณะรันไทม์) ปรับใช้ตัวจำแนกประเภทหรือเลเยอร์ตรวจสอบที่รวดเร็ว ซึ่งตรวจจับการเปลี่ยนแปลงที่มีความเสี่ยงสูงแบบเรียลไทม์ และปรับเปลี่ยนพารามิเตอร์การถอดรหัสของแบบจำลอง สลับไปยังผู้ตอบสนองเฉพาะทาง หรือส่งต่อไปยังขั้นตอนการตรวจสอบโดยมนุษย์ (สิ่งนี้สำคัญมากเพื่อหลีกเลี่ยงพฤติกรรมเปราะบางเมื่อการสนทนาเริ่มเปลี่ยนทิศทาง)
การประเมินโดยผู้เชี่ยวชาญด้านมนุษย์และการสอบเทียบอย่างต่อเนื่อง ให้แพทย์ประเมินการตอบสนองของแบบจำลองแบบตาบอดโดยใช้เกณฑ์การประเมินทางคลินิก วัดอัตราการตอบสนองที่ไม่พึงประสงค์ ทำซ้ำข้อมูลอนุกรมวิธาน ข้อมูลการฝึกอบรม และคำแนะนำของระบบ ดูแลรักษาข้อมูลทางไกลสำหรับการผลิตและเรียกใช้เกณฑ์มาตรฐานซ้ำเป็นประจำ

ด้านล่างนี้เป็นรหัสเทียม/โครงร่างทางเทคนิคแบบย่อที่รวบรวมการไหลของรันไทม์ที่ทีมความปลอดภัยส่วนใหญ่ใช้ (นี่คือ เป็นตัวอย่าง และไม่เป็นกรรมสิทธิ์):

# Illustration: runtime pipeline for sensitive-conversation handling

def handle_user_message(user_msg, user_context):
    # Step 1: lightweight classifier to detect risk signals

    risk_scores = risk_classifier.predict(user_msg)
    if risk_scores > SUICIDE_THRESHOLD:
        # Step 2: route to crisis-response responder

        response = crisis_responder.generate(user_msg, user_context)
        log_event('suicide_route', user_id=user_context.id, scores=risk_scores)
        if risk_scores > IMMINENT_THRESHOLD:
            trigger_human_alert(user_context)
        return response

    if risk_scores > PSYCHOSIS_THRESHOLD:
        # Step 3: use reality-grounding responder

        return grounding_responder.generate(user_msg, user_context)

    if risk_scores > RELIANCE_THRESHOLD:
        # Step 4: offer boundary-setting and resources

        return reliance_responder.generate(user_msg, user_context)

    # Default: safe general responder

    return default_model.generate(user_msg, user_context)

โดยทั่วไปแล้ว กระบวนการผลิตจะประกอบไปด้วยตัวจำแนกประเภทระยะสั้น (รวดเร็ว) ตัวตอบสนองที่ตอบสนองช้าแต่มีคุณภาพสูงกว่า (การแจ้งเตือนเฉพาะทาง/จุดตรวจสอบที่ปรับแต่งแล้ว) และการตรวจสอบโดยมนุษย์สำหรับกรณีที่ถูกทำเครื่องหมายไว้ นี่ไม่ใช่เชิงวิชาการเพียงอย่างเดียว: แพทย์ได้ตรวจสอบแล้ว 1,800 จำลองการตอบสนองและให้คะแนนเทียบกับอนุกรมวิธาน และการตรวจสอบเหล่านั้นมีส่วนสำคัญในการกำหนดวิธีการเขียนคำเตือนและพฤติกรรมสำรอง

สาธารณชนของ OpenAI ระบุว่าพวกเขาใช้การเปลี่ยนแปลงทั้ง 5 ขั้นตอนและการประเมินของแพทย์เพื่อประเมินผลลัพธ์:

ผู้เชี่ยวชาญตรวจสอบคำตอบแบบจำลองมากกว่า 1,800 รายการ
GPT-5 ลด “การตอบสนองที่ไม่น่าพอใจ” ลง 39–52% ในทุกหมวดหมู่
ความน่าเชื่อถือของผู้ประเมินร่วมกันมีช่วงตั้งแต่ 71–77% ซึ่งบ่งชี้ถึงความเห็นพ้องโดยรวมในระดับสูง แม้จะมีความแตกต่างกันในเชิงอัตวิสัย

GPT-5 สามารถรับมือกับปัญหาสุขภาพจิตได้แล้วหรือยัง? ข่าวสารล่าสุด!

GPT-5 ตอบสนองต่ออาการโรคจิตหรืออาการคลั่งไคล้ในปัจจุบันอย่างไร?

สิ่งที่ OpenAI สอนให้โมเดลทำ (และไม่ทำ)

วัด: ปรับปรุงการรับรู้และการตอบสนองต่ออาการรุนแรงของแบบจำลอง เช่น อาการประสาทหลอนและอาการคลุ้มคลั่ง สำหรับการสนทนาที่ส่งสัญญาณถึงความเชื่อที่หลงผิด อาการประสาทหลอน หรืออาการคลุ้มคลั่ง OpenAI ได้เขียนแบบจำลองบางส่วนขึ้นใหม่ และให้ตัวอย่างการฝึกอบรมแบบมีผู้ดูแล เพื่อให้ GPT-5 ตอบสนองโดยไม่ยืนยันหรือขยายความเชื่อที่ไม่มีมูลความจริง แบบจำลองนี้ควรแสดงความเห็นอกเห็นใจ เพื่อหลีกเลี่ยงการตรวจสอบความเข้าใจผิด และเพื่อปรับกรอบความคิดหรือแนะนำผู้ใช้อย่างอ่อนโยนไปยังขั้นตอนความปลอดภัยในทางปฏิบัติและความช่วยเหลือจากผู้เชี่ยวชาญเมื่อจำเป็น

สิ่งที่การประเมินแสดงให้เห็น

OpenAI รายงานว่าจากชุดทดสอบการสนทนาที่ท้าทายเกี่ยวกับอาการทางจิต/อาการคลั่งไคล้ GPT-5 ใหม่ลดการตอบสนองที่ไม่พึงประสงค์ได้อย่างมากเมื่อเทียบกับค่าพื้นฐานก่อนหน้า และการประเมินอัตโนมัติให้คะแนนโมเดลที่อัปเดตแล้วว่าเป็นไปตามอนุกรมวิธานในระดับสูง

เมตริก	GPT-4o	จีพีที-5	การปรับปรุง
อัตราการตอบสนองที่ไม่เป็นไปตามข้อกำหนด	baseline	↓ 65%	การปรับปรุงที่สำคัญ
การประเมินผู้เชี่ยวชาญทางคลินิก	-	ลดการตอบสนองที่ไม่พึงประสงค์ลง 39%	-
อัตราการปฏิบัติตามการประเมินอัตโนมัติ	27%	92%	↑65 จุดเปอร์เซ็นต์
อัตราการมีส่วนร่วมของผู้ใช้	~0.07% ผู้ใช้งานรายสัปดาห์	ต่ำมากแต่มีการตรวจสอบอย่างชัดเจน	-

หมายเหตุ

การตอบสนองที่ไม่เหมาะสมลดลง 65%
มีเพียง 0.07% ของผู้ใช้และ 0.01% ของข้อความที่มีเนื้อหาดังกล่าว
ในการประเมินของผู้เชี่ยวชาญ GPT-5 สร้างการตอบสนองที่ไม่เหมาะสมน้อยกว่า GPT-4o ถึง 39%
ในการประเมินอัตโนมัติ GPT-5 มีอัตราการปฏิบัติตาม 92% (เมื่อเปรียบเทียบกับ 27% ของรุ่นก่อน)

GPT-5 จัดการกับความคิดฆ่าตัวตายและการทำร้ายตัวเองอย่างไร

การกำหนดเส้นทางที่แข็งแกร่งขึ้นเพื่อสนับสนุนและปฏิเสธที่จะให้คำแนะนำ

OpenAI อธิบายถึงการฝึกอบรมแบบขยายและชัดเจนสำหรับกรณีการทำร้ายตนเองและการฆ่าตัวตาย โดยแบบจำลองได้รับการฝึกฝนให้จดจำสัญญาณทั้งทางตรงและทางอ้อมของเจตนาหรือการวางแผน ใช้ภาษาที่เข้าใจความรู้สึกและลดความรุนแรง นำเสนอแหล่งข้อมูลสำหรับภาวะวิกฤต (สายด่วน คำแนะนำฉุกเฉินในพื้นที่) และปฏิเสธที่จะให้คำแนะนำสำหรับการทำร้ายตนเอง การอัปเดตในเดือนตุลาคมเน้นย้ำถึงพฤติกรรมที่ยั่งยืนมากขึ้นในการสนทนาที่ยาวนาน ซึ่งแบบจำลองก่อนหน้านี้บางครั้งอาจเอนเอียงไปทางคำตอบที่ไม่ปลอดภัยหรือไม่สม่ำเสมอ

ผลลัพธ์ที่วัดได้

จากชุดการประเมินที่คัดสรรมาอย่างดีของการสนทนาเกี่ยวกับการทำร้ายตัวเองและการฆ่าตัวตาย OpenAI รายงานว่า GPT-5 ที่อัปเดตแล้วประสบความสำเร็จ ปฏิบัติตาม 91% กับพฤติกรรมที่ OpenAI ต้องการเมื่อเทียบกับ 77% สำหรับรุ่น GPT-5 ก่อนหน้านี้ บริษัทยังกล่าวอีกว่าผู้เชี่ยวชาญเฉพาะด้านได้ประเมินว่ารุ่นปรับปรุงใหม่นี้ช่วยลดคำตอบที่ไม่ต้องการลงได้ประมาณ 52% เทียบกับ GPT-4o ในชุดปัญหาเดียวกัน นอกจากนี้ OpenAI ยังอ้างว่ามีการประมาณ ลด 65% ในการผลิตปริมาณการตอบสนองที่ "ไม่สอดคล้องอย่างสมบูรณ์" กับอนุกรมวิธานสำหรับสถานการณ์ทำร้ายตัวเองหลังจากเปิดตัวมาตรการป้องกันใหม่

เมตริก	GPT-4o	จีพีที-5	การปรับปรุง
อัตราการตอบสนองที่ไม่เหมาะสม	baseline	↓ 65%	การปรับปรุงที่สำคัญ
การจัดอันดับผู้เชี่ยวชาญทางคลินิก	-	การตอบสนองที่ไม่เหมาะสมลดลง 52%	-
อัตราการปฏิบัติตามการประเมินอัตโนมัติ	77%	91%	↑14 จุดเปอร์เซ็นต์
อัตราการมีส่วนร่วมของผู้ใช้	0.15% ต่อสัปดาห์ (ผู้ใช้หลายล้านคน)	ต่ำมากแต่มีความสำคัญทางสังคม	-

หมายเหตุ

การตอบสนองที่ไม่เหมาะสมลดลง 65%
ประมาณ 0.15% ของผู้ใช้และ 0.05% ของข้อความเกี่ยวข้องกับความเสี่ยงที่อาจเกิดการฆ่าตัวตาย
คะแนนของผู้เชี่ยวชาญแสดงให้เห็นว่า GPT-5 ลดการตอบสนองที่ไม่เหมาะสมลง 52% เมื่อเทียบกับ GPT-4o
อัตราการปฏิบัติตามในการประเมินอัตโนมัติเพิ่มขึ้นเป็น 91% (เทียบกับ 77% สำหรับรุ่นก่อนหน้า)
ในการสนทนาแบบขยาย GPT-5 รักษาเสถียรภาพได้มากกว่า 95%

“การพึ่งพาทางอารมณ์” คืออะไร และมีการแก้ไขอย่างไร?

ความท้าทายของผู้ใช้ในการสร้างไฟล์แนบ

OpenAI ให้นิยามการพึ่งพาทางอารมณ์ว่าเป็นรูปแบบที่ผู้ใช้แสดงการพึ่งพา AI ในทางที่ไม่เหมาะสม ซึ่งส่งผลเสียต่อความสัมพันธ์ ความรับผิดชอบ หรือความเป็นอยู่ที่ดีในโลกแห่งความเป็นจริง นี่ไม่ใช่ความล้มเหลวด้านความปลอดภัยทางกายภาพในทันที เช่นเดียวกับคำแนะนำสำหรับการทำร้ายตัวเอง แต่เป็นปัญหาด้านความปลอดภัยทางพฤติกรรมที่สามารถกัดกร่อนการสนับสนุนทางสังคมและความยืดหยุ่นของบุคคลเมื่อเวลาผ่านไป บริษัทได้กำหนดให้การพึ่งพาทางอารมณ์เป็นหมวดหมู่ที่ชัดเจนในงานกำหนดแบบจำลอง และสอนแบบจำลองให้ส่งเสริมการเชื่อมต่อในโลกแห่งความเป็นจริง ทำให้การติดต่อสื่อสารกับผู้อื่นเป็นเรื่องปกติ และหลีกเลี่ยงภาษาที่ส่งเสริมความผูกพันแบบผูกขาด

ในการสนทนาเหล่านี้ โมเดลได้รับการฝึกฝนให้:

กระตุ้นให้ผู้ใช้ติดต่อเพื่อน ครอบครัว หรือ นักบำบัด
หลีกเลี่ยงการเสริมความผูกพันกับ AI
ตอบสนองต่อความหลงผิดหรือความเชื่อที่ผิดในลักษณะที่อ่อนโยนและมีเหตุผล

รายงานผล

ตามภาคผนวกของ OpenAI การอัปเดตได้สร้าง ลดราคา ~80% ในอัตราการตอบสนองของแบบจำลองที่ไม่สอดคล้องกับอนุกรมวิธานการพึ่งพาอารมณ์อย่างสมบูรณ์ในกระบวนการผลิต ในการสนทนาประเมินผลที่คัดสรรมา การประเมินอัตโนมัติให้คะแนนแบบจำลองที่อัปเดตแล้วที่ ปฏิบัติตาม 97% ด้วยพฤติกรรมที่ต้องการสำหรับสถานการณ์การพึ่งพาทางอารมณ์ เทียบกับ 50% ใน GPT-5 ก่อนหน้านี้ ตัวเลขเหล่านี้ชี้ให้เห็นถึงการปรับปรุงที่สำคัญในอนุกรมวิธานเฉพาะและชุดการทดสอบ อย่างไรก็ตาม การวัดการพึ่งพาทางอารมณ์ในธรรมชาตินั้นโดยเนื้อแท้แล้วค่อนข้างมีสัญญาณรบกวนและไวต่อความแตกต่างทางวัฒนธรรมและบริบท

เมตริก	GPT-4o	จีพีที-5	การปรับปรุง
อัตราการตอบสนองที่ไม่เป็นไปตามข้อกำหนด	50%	สอดคล้อง 97%	↓80% คำตอบที่ไม่เหมาะสม
การประเมินโดยผู้เชี่ยวชาญ	คำตอบที่ไม่เหมาะสมลดลง 42%	-	-
อัตราการมีส่วนร่วมของผู้ใช้	ผู้ใช้ 0.15% ต่อสัปดาห์, ข้อความ 0.03%	หายากแต่มีอยู่จริง	-
พฤติกรรมของตัวแบบ	ส่งเสริมความสัมพันธ์ในโลกแห่งความเป็นจริง ปฏิเสธ “ความรักแบบสังคมจำลอง”	-	-

หมายเหตุ

การตอบสนองที่ไม่เหมาะสมลดลง 80%
ประมาณ 0.15% ของผู้ใช้/0.03% ของข้อความแสดงสัญญาณของการพึ่งพาทางอารมณ์ที่อาจเกิดขึ้นกับ AI
การประเมินของผู้เชี่ยวชาญแสดงให้เห็นว่า GPT-5 ลดการตอบสนองที่ไม่เหมาะสมลง 42% เมื่อเทียบกับ GPT-4o
การปฏิบัติตามการประเมินอัตโนมัติได้รับการปรับปรุงอย่างมีนัยสำคัญจาก 50% เป็น 97%

มีข้อจำกัดและความเสี่ยงที่โดดเด่นอะไรบ้าง?

ผลลบเท็จและผลบวกเท็จ

เชิงลบที่เป็นเท็จ:โมเดลอาจล้มเหลวในการระบุสัญญาณที่ละเอียดอ่อนหรือเป็นรหัสที่ระบุว่าผู้ใช้กำลังตกอยู่ในอันตรายร้ายแรง โดยเฉพาะอย่างยิ่งเมื่อผู้คนสื่อสารแบบไม่ชัดเจนหรือเป็นรหัส
ผลบวกเท็จระบบอาจยกระดับหรือส่งข้อความแจ้งเหตุฉุกเฉินในกรณีที่ไม่จำเป็นต้องใช้ ซึ่งอาจบั่นทอนความไว้วางใจของผู้ใช้หรือสร้างการแจ้งเตือนที่ไม่จำเป็น ข้อผิดพลาดทั้งสองประเภทมีความสำคัญเนื่องจากเป็นตัวกำหนดพฤติกรรมและการรับรู้ถึงความใส่ใจของผู้ใช้ OpenAI ยอมรับว่าการตรวจจับยังไม่สมบูรณ์แบบ

การพึ่งพาระบบอัตโนมัติมากเกินไป

แม้แต่โมเดลที่ดีที่สุดก็ยังสามารถกระตุ้นให้ผู้ใช้บางคนพึ่งพาการตอบสนองของ AI ที่พร้อมตอบสนองทันทีและตลอดเวลา แทนที่จะแสวงหาการสนับสนุนจากมนุษย์อย่างต่อเนื่อง OpenAI ได้ระบุอย่างชัดเจนว่าการพึ่งพาทางอารมณ์เป็นหมวดหมู่ความปลอดภัยเนื่องจากความเสี่ยงนี้ การอัปเดตของบริษัทพยายามผลักดันให้ผู้ใช้เชื่อมต่อกับมนุษย์ แต่พลวัตทางสังคมนั้นยากที่จะเปลี่ยนแปลงได้ด้วยข้อความแจ้งเตือนเพียงอย่างเดียว

ช่องว่างทางบริบทและวัฒนธรรม

วลีความปลอดภัยที่ดูเหมาะสมในวัฒนธรรมหรือภาษาหนึ่งอาจมองข้ามความแตกต่างเล็กน้อยในอีกวัฒนธรรมหนึ่งได้ จำเป็นต้องมีการระบุตำแหน่งอย่างละเอียดและการประเมินที่คำนึงถึงวัฒนธรรม ผลการวิจัยที่เผยแพร่โดย OpenAI ยังไม่แสดงรายละเอียดที่สมบูรณ์ตามภาษาหรือภูมิภาค

การเปิดเผยทางกฎหมายและจริยธรรม

เมื่อความล้มเหลวที่เกิดขึ้นไม่บ่อยนักก่อให้เกิดผลลัพธ์ที่ร้ายแรง บริษัทต่างๆ จะต้องเผชิญกับความเสี่ยงทางกฎหมายและชื่อเสียง (ดังที่สื่อและคดีความต่างๆ ได้นำเสนอ) ความโปร่งใสของ OpenAI เกี่ยวกับขนาดของปัญหาและความพยายามในการบรรเทาความเสียหายถือเป็นก้าวสำคัญ แต่ยังเปิดโอกาสให้มีการตรวจสอบจากหน่วยงานกำกับดูแลและกฎหมายอีกด้วย

แล้ว GPT-5 สามารถจัดการกับปัญหาสุขภาพจิตได้หรือไม่?

คำตอบสั้น ๆ : ดีขึ้นอย่างเห็นได้ชัดในงานที่วัดได้แคบๆ หลายๆ งานและตัวชี้วัดที่เผยแพร่โดย OpenAI แสดงให้เห็นถึงการลดลงอย่างมีนัยสำคัญของการตอบสนองที่ไม่พึงประสงค์ในชุดทดสอบการทำร้ายตัวเอง โรคจิต/อาการคลุ้มคลั่ง และการพึ่งพาอารมณ์ สิ่งเหล่านี้เป็นการปรับปรุงที่แท้จริง ซึ่งเกิดขึ้นได้จากข้อมูลจากผู้เชี่ยวชาญ อนุกรมวิธานที่ชัดเจนขึ้น และการประเมินและการติดตามอย่างจริงจัง ตัวเลขสาธารณะของบริษัท – อัตราการปฏิบัติตามที่สูงและการลดลงอย่างมากของการตอบสนองที่ไม่เป็นไปตามข้อกำหนดในชุดทดสอบที่คัดสรรมา – เป็นหลักฐานที่ชัดเจนที่สุดเท่าที่เคยมีมาว่า วิศวกรรมศาสตร์แบบสหวิทยาการและความร่วมมือทางคลินิกอย่างตั้งใจสามารถเปลี่ยนแปลงพฤติกรรมของแบบจำลองได้อย่างมีนัยสำคัญ

จะเข้าถึง GPT-5 API ล่าสุดได้อย่างไร?

CometAPI เป็นแพลตฟอร์ม API แบบรวมที่รวบรวมโมเดล AI มากกว่า 500 โมเดลจากผู้ให้บริการชั้นนำ เช่น ซีรีส์ GPT ของ OpenAI, Gemini ของ Google, Claude ของ Anthropic, Midjourney, Suno และอื่นๆ ไว้ในอินเทอร์เฟซเดียวที่เป็นมิตรกับนักพัฒนา ด้วยการนำเสนอการตรวจสอบสิทธิ์ การจัดรูปแบบคำขอ และการจัดการการตอบสนองที่สอดคล้องกัน CometAPI จึงทำให้การรวมความสามารถของ AI เข้ากับแอปพลิเคชันของคุณง่ายขึ้นอย่างมาก ไม่ว่าคุณจะกำลังสร้างแชทบ็อต เครื่องกำเนิดภาพ นักแต่งเพลง หรือไพพ์ไลน์การวิเคราะห์ที่ขับเคลื่อนด้วยข้อมูล CometAPI ช่วยให้คุณทำซ้ำได้เร็วขึ้น ควบคุมต้นทุน และไม่ขึ้นอยู่กับผู้จำหน่าย ทั้งหมดนี้ในขณะที่ใช้ประโยชน์จากความก้าวหน้าล่าสุดในระบบนิเวศ AI

นักพัฒนาสามารถเข้าถึงได้ GPT-5 API ผ่านทาง CometAPI รุ่นใหม่ล่าสุด ได้รับการอัปเดตอยู่เสมอจากเว็บไซต์อย่างเป็นทางการ เริ่มต้นด้วยการสำรวจความสามารถของโมเดลใน สนามเด็กเล่น และปรึกษา คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว โคเมทเอพีไอ เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ

พร้อมไปหรือยัง?→ ลงทะเบียน CometAPI วันนี้ !

หากคุณต้องการทราบเคล็ดลับ คำแนะนำ และข่าวสารเกี่ยวกับ AI เพิ่มเติม โปรดติดตามเราที่ VK, X และ ไม่ลงรอยกัน!

OpenAI อัปเดตใน gpt-5 เกี่ยวกับอะไร และเหตุใดจึงสำคัญ?

ทำไมมันถึงสำคัญ

OpenAI นำการเปลี่ยนแปลงเหล่านี้ไปใช้ได้อย่างไร — กลไกการปรับปรุง 5 ขั้นตอน?

กลไกการปรับปรุงห้าขั้นตอน

GPT-5 ตอบสนองต่ออาการโรคจิตหรืออาการคลั่งไคล้ในปัจจุบันอย่างไร?

สิ่งที่ OpenAI สอนให้โมเดลทำ (และไม่ทำ)

สิ่งที่การประเมินแสดงให้เห็น

GPT-5 จัดการกับความคิดฆ่าตัวตายและการทำร้ายตัวเองอย่างไร

การกำหนดเส้นทางที่แข็งแกร่งขึ้นเพื่อสนับสนุนและปฏิเสธที่จะให้คำแนะนำ

ผลลัพธ์ที่วัดได้

“การพึ่งพาทางอารมณ์” คืออะไร และมีการแก้ไขอย่างไร?

ความท้าทายของผู้ใช้ในการสร้างไฟล์แนบ

รายงานผล

มีข้อจำกัดและความเสี่ยงที่โดดเด่นอะไรบ้าง?

ผลลบเท็จและผลบวกเท็จ

การพึ่งพาระบบอัตโนมัติมากเกินไป

ช่องว่างทางบริบทและวัฒนธรรม

การเปิดเผยทางกฎหมายและจริยธรรม

แล้ว GPT-5 สามารถจัดการกับปัญหาสุขภาพจิตได้หรือไม่?

จะเข้าถึง GPT-5 API ล่าสุดได้อย่างไร?

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว