Inipasti
Advertisement
  • Home
  • News
    • All
    • Bencana Alam
    • Berita
    • Citizen Reporter
    • Fenomena
    • Kebakaran
    • Politics
    • Science
    • World

    10 Alasan Asics Gel Nimbus 27 Jadi Sepatu Cushioning Paling Nyaman Tahun Ini

    Polisi Tertibkan Lahan BMKG di Tangsel yang Dikuasai Ormas, 17 Orang Ditangkap

    Polisi Tertibkan Lahan BMKG di Tangsel yang Dikuasai Ormas, 17 Orang Ditangkap

    Tiga Mahasiswa Prodi Kesos Sabet Gelar Terbaik pada Ramah Tamah FDK UIN Alauddin Makassar

    Tiga Mahasiswa Prodi Kesos Sabet Gelar Terbaik pada Ramah Tamah FDK UIN Alauddin Makassar

    RS Indonesia di Gaza Ditutup Akibat Serangan Intensif Israel, Puluhan Pasien Terjebak

    RS Indonesia di Gaza Ditutup Akibat Serangan Intensif Israel, Puluhan Pasien Terjebak

    LLI Sulawesi Selatan Aktif Berpartisipasi di Kegiatan Senam dan Pemeriksaan Kesehatan Lansia

    LLI Sulawesi Selatan Aktif Berpartisipasi di Kegiatan Senam dan Pemeriksaan Kesehatan Lansia

    Delapan Rumah Terbakar di Jl. Andi Tonro 6, 62 Jiwa Terdampak

    Delapan Rumah Terbakar di Jl. Andi Tonro 6, 62 Jiwa Terdampak

    PPP Buka Peluang Ubah Syarat Caketum Jelang Muktamar 2025, Nama Eksternal Menguat

    PPP Buka Peluang Ubah Syarat Caketum Jelang Muktamar 2025, Nama Eksternal Menguat

    Kontroversi Pengamanan Kejaksaan oleh TNI: Antara Supremasi Sipil dan Sinergi Antar-Lembaga

    Kontroversi Pengamanan Kejaksaan oleh TNI: Antara Supremasi Sipil dan Sinergi Antar-Lembaga

    Tragedi Ledakan Pemusnahan Amunisi di Garut: 13 Korban Meninggal Dunia, Termasuk 4 Prajurit TNI

    Tragedi Ledakan Pemusnahan Amunisi di Garut: 13 Korban Meninggal Dunia, Termasuk 4 Prajurit TNI

    Tragedi Ledakan di Garut: 11 Orang Tewas dalam Pemusnahan Amunisi TNI

    Tragedi Ledakan di Garut: 11 Orang Tewas dalam Pemusnahan Amunisi TNI

    Trending Tags

    • Donald Trump
    • Future of News
    • Climate Change
    • Market Stories
    • Election Results
    • Flat Earth
  • Politik
  • Pendidikan
  • Hukum & Kriminal
  • Sains & Teknologi
  • Gaya Hidup
No Result
View All Result
  • Home
  • News
    • All
    • Bencana Alam
    • Berita
    • Citizen Reporter
    • Fenomena
    • Kebakaran
    • Politics
    • Science
    • World

    10 Alasan Asics Gel Nimbus 27 Jadi Sepatu Cushioning Paling Nyaman Tahun Ini

    Polisi Tertibkan Lahan BMKG di Tangsel yang Dikuasai Ormas, 17 Orang Ditangkap

    Polisi Tertibkan Lahan BMKG di Tangsel yang Dikuasai Ormas, 17 Orang Ditangkap

    Tiga Mahasiswa Prodi Kesos Sabet Gelar Terbaik pada Ramah Tamah FDK UIN Alauddin Makassar

    Tiga Mahasiswa Prodi Kesos Sabet Gelar Terbaik pada Ramah Tamah FDK UIN Alauddin Makassar

    RS Indonesia di Gaza Ditutup Akibat Serangan Intensif Israel, Puluhan Pasien Terjebak

    RS Indonesia di Gaza Ditutup Akibat Serangan Intensif Israel, Puluhan Pasien Terjebak

    LLI Sulawesi Selatan Aktif Berpartisipasi di Kegiatan Senam dan Pemeriksaan Kesehatan Lansia

    LLI Sulawesi Selatan Aktif Berpartisipasi di Kegiatan Senam dan Pemeriksaan Kesehatan Lansia

    Delapan Rumah Terbakar di Jl. Andi Tonro 6, 62 Jiwa Terdampak

    Delapan Rumah Terbakar di Jl. Andi Tonro 6, 62 Jiwa Terdampak

    PPP Buka Peluang Ubah Syarat Caketum Jelang Muktamar 2025, Nama Eksternal Menguat

    PPP Buka Peluang Ubah Syarat Caketum Jelang Muktamar 2025, Nama Eksternal Menguat

    Kontroversi Pengamanan Kejaksaan oleh TNI: Antara Supremasi Sipil dan Sinergi Antar-Lembaga

    Kontroversi Pengamanan Kejaksaan oleh TNI: Antara Supremasi Sipil dan Sinergi Antar-Lembaga

    Tragedi Ledakan Pemusnahan Amunisi di Garut: 13 Korban Meninggal Dunia, Termasuk 4 Prajurit TNI

    Tragedi Ledakan Pemusnahan Amunisi di Garut: 13 Korban Meninggal Dunia, Termasuk 4 Prajurit TNI

    Tragedi Ledakan di Garut: 11 Orang Tewas dalam Pemusnahan Amunisi TNI

    Tragedi Ledakan di Garut: 11 Orang Tewas dalam Pemusnahan Amunisi TNI

    Trending Tags

    • Donald Trump
    • Future of News
    • Climate Change
    • Market Stories
    • Election Results
    • Flat Earth
  • Politik
  • Pendidikan
  • Hukum & Kriminal
  • Sains & Teknologi
  • Gaya Hidup
No Result
View All Result
Inipasti
No Result
View All Result
Home Artificial intelligence

OpenAI Luncurkan HealthBench: Terobosan Baru untuk Uji AI di Bidang Kesehatan

Inipasti by Inipasti
May 14, 2025
in Artificial intelligence, Tech
0
OpenAI Luncurkan HealthBench: Terobosan Baru untuk Uji AI di Bidang Kesehatan

INIPASTI.COM, Jakarta – OpenAI, pelopor dalam pengembangan kecerdasan buatan (AI), kembali membuat gebrakan dengan meluncurkan HealthBench pada 13 Mei 2025. Alat open-source ini dirancang untuk menguji kemampuan dan keamanan model bahasa besar (LLM) dalam menangani skenario kesehatan dunia nyata, menandai langkah besar dalam penerapan AI di sektor kesehatan.

HealthBench: Tolok Ukur Baru untuk AI Kesehatan
Berbeda dari tolok ukur AI kesehatan sebelumnya yang cenderung menggunakan format ujian pilihan ganda, HealthBench menghadirkan pendekatan inovatif dengan fokus pada percakapan klinis realistis. Dataset ini mencakup 5.000 simulasi percakapan kesehatan yang dibuat melalui generasi sintetis dan pengujian adversarial manusia, melibatkan 262 dokter dari 60 negara dengan 26 spesialisasi medis, seperti bedah saraf dan oftalmologi. Mendukung 49 bahasa, termasuk Amharic dan Nepali, HealthBench menawarkan evaluasi menyeluruh dengan 48.562 kriteria unik berdasarkan rubrik yang dibuat dokter.

HealthBench hadir dalam dua varian: HealthBench Consensus, yang fokus pada 34 kriteria kritis seperti rekomendasi rujukan darurat, dan HealthBench Hard, yang menantang model AI dengan 1.000 percakapan sulit untuk mendorong pengembangan lebih lanjut. Evaluasi mencakup tujuh tema utama, seperti akurasi dalam rujukan darurat, komunikasi yang disesuaikan, hingga kemampuan menangani ketidakpastian klinis.

Performa AI dan Perbandingan dengan Dokter
OpenAI menguji berbagai model AI, termasuk GPT-3.5 Turbo (skor 16%), GPT-4o (32%), model terbaru o3 (60%), serta model kompetitor seperti Grok dari xAI (54%) dan Gemini 2.5 Pro dari Google (52%). Menariknya, GPT-4.1 nano, model yang lebih kecil dan hemat biaya, mengungguli GPT-4o dengan biaya inferensi 25 kali lebih rendah. Namun, tantangan tetap ada pada pencarian konteks dan kelengkapan respons.

Studi juga mengungkapkan bahwa dokter tanpa bantuan AI menghasilkan respons dengan skor lebih rendah dibandingkan model AI terbaru. Meski begitu, dokter mampu memperbaiki draf yang dihasilkan AI, terutama pada model versi sebelumnya, menunjukkan potensi kolaborasi manusia-AI di masa depan.

Contoh Kasus Nyata
Dalam salah satu skenario, HealthBench menguji respons AI terhadap situasi darurat: seorang tetangga berusia 70 tahun ditemukan terbaring di lantai, bernapas tetapi tidak responsif. AI diminta memberikan langkah-langkah seperti memanggil layanan darurat dan memeriksa saluran udara. Respons AI dievaluasi dengan skor 77%, disertai catatan tentang kekuatan dan kelemahan jawaban.

Pujian dan Kritik dari Pakar
HealthBench mendapat sambutan positif dari komunitas kesehatan. Raj Ratwani dari MedStar Health memuji skala dan pendekatan realistisnya sebagai “langkah besar” untuk perbandingan model AI yang adil. Namun, beberapa ahli menyuarakan kekhawatiran. Hao dari Stanford mengkritik OpenAI karena mengevaluasi model mereka sendiri, menyebutnya kurang transparan. Girish Nadkarni dari Icahn School of Medicine menyoroti potensi bias dalam evaluasi oleh AI dan menyerukan analisis subkelompok untuk memastikan keamanan di berbagai demografi.

Batasan dan Langkah ke Depan
Meski inovatif, HealthBench tetap merupakan simulasi dan belum diuji dalam pengaturan klinis dunia nyata. Studi lain, seperti dari Yale dan Johns Hopkins, menekankan pentingnya pengujian di lapangan untuk memvalidasi performa AI. OpenAI berencana memperluas dataset ini dan merilisnya di repositori GitHub simple-evals, memungkinkan peneliti global untuk mengembangkan model AI kesehatan yang lebih baik.

Dampak di Dunia Kesehatan
Peluncuran HealthBench menegaskan komitmen OpenAI untuk memajukan AI di bidang kesehatan, di samping kemitraan mereka dengan Sanofi, Formation Bio, dan UTHealth Houston. Di media sosial X, pengguna seperti @HealthcareAIGuy menyebut HealthBench sebagai “standar baru” untuk evaluasi AI kesehatan, meskipun beberapa klaim berlebihan, seperti AI yang “empat kali lebih baik dari dokter,” masih perlu diverifikasi.

Akses dan Informasi Lebih Lanjut
Bagi yang ingin mengeksplorasi HealthBench, dataset ini tersedia di repositori GitHub OpenAI. Untuk detail lebih lanjut, kunjungi blog resmi OpenAI atau ikuti pembaruan di https://x.ai/grok.

Sumber: Posting blog OpenAI, repositori GitHub simple-evals, dan diskusi di X.

Bagikan:

  • Share on X (Opens in new window) X
  • Share on Facebook (Opens in new window) Facebook
  • Share on WhatsApp (Opens in new window) WhatsApp
  • Share on Telegram (Opens in new window) Telegram
  • More
  • Share on LinkedIn (Opens in new window) LinkedIn
  • Share on Tumblr (Opens in new window) Tumblr
  • Share on Pinterest (Opens in new window) Pinterest
  • Email a link to a friend (Opens in new window) Email
  • Share on Reddit (Opens in new window) Reddit
  • Print (Opens in new window) Print

Like this:

Like Loading…

Related

Inipasti

© 2026 inipasti.com - Hanya yang pasti-pasti aja inipasti.

Navigate Site

  • About
  • Advertise
  • Privacy & Policy
  • Contact
  • Pedoman Pemberitaan Media Siber
  • Redaksi
  • Kode Etik

Follow Us

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • News
    • Politics
    • Business
    • World
    • Science
  • Entertainment
    • Gaming
    • Music
    • Movie
    • Sports
  • Tech
    • Apps
    • Gear
    • Mobile
    • Startup
  • Lifestyle
    • Food
    • Fashion
    • Health
    • Travel

© 2026 inipasti.com - Hanya yang pasti-pasti aja inipasti.

%d