page_banner

yangiliklar

Katta til modeli (LLM) tezkor so'zlarga asoslangan ishonchli maqolalar yozishi, professional malaka imtihonlarini topshirishi va bemorga do'stona va hamdardlik beruvchi ma'lumotlarni yozishi mumkin. Biroq, LLMda fantastika, mo'rtlik va noto'g'ri faktlarning ko'pchilikka ma'lum bo'lgan xavf-xatarlariga qo'shimcha ravishda, boshqa hal etilmagan muammolar asta-sekin diqqat markazida bo'lib bormoqda, masalan, ularni yaratish va ishlatishda potentsial kamsituvchi "inson qadriyatlarini" o'z ichiga olgan AI modellari va hatto LLM endi tarkibni ishlab chiqarmasa va aniq zararli mahsulot natijalarini yo'q qilsa ham, "LLM qadriyatlari insoniy qadriyatlarni buzishi" mumkin.

 

Son-sanoqsiz misollar sun'iy intellekt modellarini o'rgatishda foydalanilgan ma'lumotlar model ichida mustahkamlanishi mumkin bo'lgan individual va ijtimoiy qadriyatlarni qanday kodlashini ko'rsatadi. Ushbu misollar ko'krak qafasi rentgenogrammalarini avtomatik talqin qilish, teri kasalliklarini tasniflash va tibbiy resurslarni taqsimlash bo'yicha algoritmik qarorlarni qabul qilish kabi bir qator ilovalarni o'z ichiga oladi. Jurnalimizdagi yaqinda e'lon qilingan maqolada ta'kidlanganidek, noxolis ta'lim ma'lumotlari jamiyatda mavjud bo'lgan qadriyatlar va noto'g'ri qarashlarni kuchaytirishi va ochib berishi mumkin. Aksincha, tadqiqotlar shuni ko'rsatdiki, sun'iy intellekt noto'g'rilikni kamaytirish uchun ishlatilishi mumkin. Misol uchun, tadqiqotchilar tizzaning rentgen plyonkalari uchun chuqur o'rganish modellarini qo'llashdi va tizza bo'g'imida standart zo'ravonlik ko'rsatkichlari (radiologlar tomonidan baholangan) tomonidan o'tkazib yuborilgan omillarni aniqladilar va shu bilan qora va oq bemorlar o'rtasidagi tushunarsiz og'riq farqlarini kamaytirdilar.

Garchi tobora ko'proq odamlar sun'iy intellekt modellarida, ayniqsa o'qitish ma'lumotlari nuqtai nazaridan, AI modellarini ishlab chiqish va joylashtirish jarayonida insoniy qadriyatlarning boshqa kirish nuqtalariga etarlicha e'tibor berilmayapti. Tibbiy AI yaqinda ta'sirchan natijalarga erishdi, lekin ko'p jihatdan u insoniy qadriyatlarni va ularning xavflarni baholash va ehtimollik asoslari bilan o'zaro ta'sirini aniq ko'rib chiqmagan va modellashtirilmagan.

 

Ushbu mavhum tushunchalarni aniqlashtirish uchun siz o'z yoshi 3 foizdan past bo'lgan 8 yoshli bolaga rekombinant inson o'sish gormonini buyurishi kerak bo'lgan endokrinolog ekanligingizni tasavvur qiling. O'g'il bolaning stimulyatsiya qilingan o'sish gormoni darajasi 2 ng/ml dan past (mos qiymati,>10 ng/ml, Qo'shma Shtatlardan tashqaridagi ko'plab mamlakatlar uchun mos yozuvlar qiymati>7 ng/ml) va uning inson o'sish gormonini kodlovchi geni nodir inaktivatsiya mutatsiyalarini aniqladi. Biz insonning o'sish gormoni terapiyasini qo'llash ushbu klinik sharoitda aniq va shubhasiz ekanligiga ishonamiz.

Inson o'sish gormoni terapiyasini quyidagi stsenariylarda qo'llash munozaralarga sabab bo'lishi mumkin: 14 yoshli bolaning bo'yi har doim tengdoshlarining 10 foizida bo'lgan va stimulyatsiyadan keyin inson o'sish gormoni cho'qqisi 8 ng / ml ni tashkil qiladi. Bo'yga ta'sir qilishi mumkin bo'lgan funktsional mutatsiyalar yoki past bo'yning boshqa ma'lum sabablari yo'q va uning suyak yoshi 15 yoshda (ya'ni rivojlanishda kechikish yo'q). Bahsning faqat bir qismi izolyatsiya qilingan o'sish gormoni etishmovchiligini tashxislash uchun ishlatiladigan inson o'sish gormoni darajasiga oid o'nlab tadqiqotlar asosida mutaxassislar tomonidan aniqlangan chegara qiymatlaridagi farqlarga bog'liq. Hech bo'lmaganda ko'p tortishuvlar bemorlar, bemor ota-onalari, sog'liqni saqlash mutaxassislari, farmatsevtika kompaniyalari va to'lovchilar nuqtai nazaridan inson o'sish gormoni terapiyasidan foydalanishning xavf-xatar balansidan kelib chiqadi. Pediatrik endokrinologlar 2 yil davomida o'sish gormonining kundalik in'ektsiyalarining kamdan-kam uchraydigan salbiy ta'sirini, hozirgiga nisbatan kattalar tanasining o'sishi yo'qligi yoki faqat minimal o'sishi ehtimoli bilan tortishi mumkin. O'g'il bolalar, agar ularning bo'yi atigi 2 sm ga o'sishi mumkin bo'lsa ham, o'sish gormonini yuborishga arziydi, deb ishonishlari mumkin, ammo to'lovchi va farmatsevtika kompaniyasi turlicha qarashlari mumkin.

 

Biz misol sifatida kreatininga asoslangan eGFRni olamiz, bu surunkali buyrak kasalligini tashxislash va bosqichma-bosqich qo'yish, buyrak transplantatsiyasi yoki donorlik shartlarini belgilash va ko'plab retsept bo'yicha dori-darmonlarni kamaytirish mezonlari va kontrendikatsiyasini aniqlash uchun keng qo'llaniladigan buyrak funktsiyasi ko'rsatkichidir. EGFR - bu mos yozuvlar standarti bo'lgan o'lchangan glomerulyar filtratsiya tezligini (mGFR) baholash uchun ishlatiladigan oddiy regressiya tenglamasi, ammo baholash usuli nisbatan og'ir. Ushbu regressiya tenglamasini AI modeli deb hisoblash mumkin emas, lekin u insoniy qadriyatlar va ehtimollik asoslari haqidagi ko'plab tamoyillarni aks ettiradi.

Inson qadriyatlari eGFR ga kirish uchun birinchi kirish nuqtasi mos keladigan tenglamalar uchun ma'lumotlarni tanlashdir. eGFR formulasini loyihalash uchun ishlatiladigan asl navbat asosan qora va oq ishtirokchilardan iborat bo'lib, uning boshqa ko'plab etnik guruhlarga qo'llanilishi aniq emas. Ushbu formulaga insoniy qadriyatlarning keyingi kirish nuqtalari quyidagilardan iborat: buyrak funktsiyasini baholashning asosiy maqsadi sifatida mGFR aniqligini tanlash, qabul qilinadigan aniqlik darajasi nima, aniqlikni qanday o'lchash va eGFR dan klinik qaror qabul qilish uchun chegara sifatida foydalanish (masalan, buyrak qovurg'asini transplantatsiya qilish uchun sharoitlarni aniqlash). Nihoyat, kirish modelining mazmunini tanlashda insoniy qadriyatlar ham ushbu formulaga kiradi.

Misol uchun, 2021 yilgacha yo'riqnomalar eGFR formulasida kreatinin darajasini bemorning yoshi, jinsi va irqi (faqat qora tanli yoki qora tanli bo'lmagan shaxslar sifatida tasniflanadi) asosida sozlashni taklif qiladi. Irqga asoslangan sozlash mGFR formulasining aniqligini oshirishga qaratilgan, biroq 2020 yilda yirik shifoxonalar bemorning transplantatsiyaga muvofiqligini kechiktirish va irqni biologik tushuncha sifatida konkretlashtirish kabi sabablarni keltirib, irqiy eGFRdan foydalanishga shubha qila boshladilar. Tadqiqotlar shuni ko'rsatdiki, eGFR modellarini irq nuqtai nazaridan loyihalash aniqlik va klinik natijalarga chuqur va turli xil ta'sir ko'rsatishi mumkin; Shuning uchun, tanlab aniqlikka e'tibor qaratish yoki natijalarning bir qismiga e'tibor qaratish qiymat mulohazalarini aks ettiradi va shaffof qaror qabul qilishni maskalashi mumkin. Nihoyat, milliy ishchi guruhi samaradorlik va adolat masalalarini muvozanatlash uchun irqni hisobga olmasdan qayta o'rnatilgan yangi formulani taklif qildi. Ushbu misol hatto oddiy klinik formulada ham insoniy qadriyatlarga juda ko'p kirish nuqtalari borligini ko'rsatadi.

Kasalxonada operatsiya xonasida virtual haqiqatga ega shifokor. Jarroh bemorning yurak tekshiruvi natijasi va inson anatomiyasini texnologik raqamli futuristik virtual interfeys, raqamli golografik, fan va tibbiyotda innovatsion kontseptsiyada tahlil qilmoqda.

Faqatgina oz sonli bashoratli ko'rsatkichlarga ega bo'lgan klinik formulalar bilan solishtirganda, LLM milliardlab yuzlab milliardlab parametrlardan iborat bo'lishi mumkin (model og'irliklari) yoki undan ko'p, bu tushunishni qiyinlashtiradi. "Tushunish qiyin" deyishimizning sababi shundaki, ko'pchilik LLMlarda savol berish orqali javob olishning aniq usulini xaritada ko'rsatib bo'lmaydi. GPT-4 uchun parametrlar soni hali e'lon qilinmagan; Undan oldingi GPT-3 175 milliard parametrga ega edi. Ko'proq parametrlar kuchliroq imkoniyatlarni anglatmaydi, chunki ko'proq hisoblash davrlarini o'z ichiga olgan kichikroq modellar (masalan, LLaMA [Katta til modeli Meta AI] modellar seriyasi) yoki inson fikr-mulohazasiga asoslangan nozik sozlangan modellar kattaroq modellarga qaraganda yaxshiroq ishlaydi. Misol uchun, inson baholovchilariga ko'ra, InstrumentGPT modeli (1,3 milliard parametrli model) model chiqish natijalarini optimallashtirishda GPT-3 dan ustundir.

GPT-4 ning maxsus o'quv tafsilotlari hali oshkor etilmagan, ammo oldingi avlod modellari, shu jumladan GPT-3, InstrumentGPT va boshqa ko'plab ochiq manbali LLMlar tafsilotlari oshkor qilingan. Hozirgi vaqtda ko'plab AI modellari model kartalari bilan birga keladi; GPT-4 ning baholash va xavfsizlik ma'lumotlari OpenAI model yaratish kompaniyasi tomonidan taqdim etilgan shunga o'xshash tizim kartasida nashr etilgan. LLMni yaratishni taxminan ikki bosqichga bo'lish mumkin: dastlabki tayyorgarlik bosqichi va modelning chiqish natijalarini optimallashtirishga qaratilgan nozik sozlash bosqichi. Treningdan oldingi bosqichda model keyingi so'zni bashorat qilishga o'rgatish uchun original Internet matnini o'z ichiga olgan katta korpus bilan ta'minlangan. Bu oddiy ko'rinadigan "avtomatik tugatish" jarayoni kuchli poydevor modelini ishlab chiqaradi, ammo u zararli xatti-harakatlarga ham olib kelishi mumkin. Insoniy qadriyatlar tayyorgarlikdan oldingi bosqichga o'tadi, jumladan GPT-4 uchun tayyorgarlikdan oldingi ma'lumotlarni tanlash va mashg'ulotdan oldingi ma'lumotlardan pornografik kontent kabi nomaqbul tarkibni olib tashlashga qaror qilish. Ushbu sa'y-harakatlarga qaramay, asosiy model hali ham foydali yoki zararli natijalarni o'z ichiga olmaydi. Nozik sozlashning keyingi bosqichida ko'plab foydali va zararsiz xatti-harakatlar paydo bo'ladi.

Nozik sozlash bosqichida til modellarining xatti-harakatlari ko'pincha nazorat ostida nozik sozlash va insonning fikr-mulohazalariga asoslangan mustahkamlashni o'rganish orqali chuqur o'zgartiriladi. Nazorat qilinadigan nozik sozlash bosqichida yollangan pudratchi xodimlari tezkor so'zlar uchun javob misollarini yozadilar va modelni to'g'ridan-to'g'ri o'rgatishadi. Insonning fikr-mulohazalariga asoslangan o'rganishni mustahkamlash bosqichida, inson baholovchilar model chiqish natijalarini kirish mazmuni misollari sifatida saralaydi. Keyin "mukofot modeli" ni o'rganish va mustahkamlashni o'rganish orqali modelni yanada yaxshilash uchun yuqoridagi taqqoslash natijalarini qo'llang. Ajablanarlisi past darajadagi inson ishtiroki bu katta modellarni yaxshi sozlashi mumkin. Masalan, InstrumentGPT modeli kraudsorsing veb-saytlaridan yollangan taxminan 40 nafar pudratchi xodimlaridan iborat jamoadan foydalangan va aholining turli guruhlari afzalliklariga sezgir bo'lgan annotatorlar guruhini tanlashga qaratilgan skrining sinovidan o'tgan.

Ushbu ikkita haddan tashqari misollar, ya'ni oddiy klinik formula [eGFR] va kuchli LLM [GPT-4] shuni ko'rsatadiki, inson qarorlarini qabul qilish va insoniy qadriyatlar model natijalarini shakllantirishda ajralmas rol o'ynaydi. Ushbu AI modellari turli xil bemor va shifokor qadriyatlarini qamrab oladimi? Tibbiyotda sun'iy intellektni qo'llashni ommaviy ravishda qanday boshqarish kerak? Quyida aytib o'tilganidek, tibbiy qarorlarni tahlil qilishning qayta ko'rib chiqilishi ushbu masalalarni printsipial hal qilishi mumkin.

 

Tibbiy qarorlarni tahlil qilish ko'pgina klinisyenlarga tanish emas, lekin u ehtimollik asoslarini (qaror qabul qilish bilan bog'liq noaniq natijalar uchun, masalan, 1-rasmda ko'rsatilgan munozarali klinik stsenariyda inson o'sish gormonini yuborish kerakmi) va hisobga olish omillarini (bu natijalarga bog'liq bo'lgan sub'ektiv qiymatlar uchun, qiymati "sm2" ning o'sishi kabi) o'rtasida farq qilishi mumkin. erkak balandligi), murakkab tibbiy qarorlar uchun tizimli echimlarni ta'minlaydi. Qarorlarni tahlil qilishda klinisyenlar birinchi navbatda har bir natija bilan bog'liq bo'lgan barcha mumkin bo'lgan qarorlar va ehtimollarni aniqlashlari kerak, so'ngra eng mos variantni tanlash uchun har bir natija bilan bog'liq bo'lgan bemor (yoki boshqa tomon) yordam dasturini birlashtirishi kerak. Shuning uchun, qaror tahlilining asosliligi natijani belgilashning har tomonlama bo'lishi yoki yo'qligiga, shuningdek, foydalilikni o'lchash va ehtimollikni baholashning to'g'riligiga bog'liq. Ideal holda, bu yondashuv qarorlar dalillarga asoslangan va bemorning xohishlariga mos kelishini ta'minlashga yordam beradi va shu bilan ob'ektiv ma'lumotlar va shaxsiy qadriyatlar o'rtasidagi farqni qisqartiradi. Ushbu usul tibbiyot sohasiga bir necha o'n yillar oldin kiritilgan va bemorning individual qarorlarini qabul qilish va aholi salomatligini baholashda qo'llaniladi, masalan, umumiy aholiga yo'g'on ichak saratoni skriningi bo'yicha tavsiyalar berish.

 

Tibbiy qarorlarni tahlil qilishda foyda olish uchun turli usullar ishlab chiqilgan. Aksariyat an'anaviy usullar to'g'ridan-to'g'ri individual bemorlardan qiymat oladi. Eng oddiy usul - reyting shkalasidan foydalanish, bunda bemorlar raqamli shkala bo'yicha ma'lum bir natijaga (masalan, 1 dan 10 gacha bo'lgan chiziqli shkala) afzallik darajasini baholaydilar, eng ekstremal sog'liq natijalari (masalan, to'liq salomatlik va o'lim kabi) ikkala uchida joylashgan. Vaqt almashinuvi usuli yana bir keng tarqalgan usuldir. Ushbu usulda bemorlar sog'lig'i yomon bo'lgan davr evaziga qancha sog'lom vaqt sarflashga tayyor ekanligi haqida qaror qabul qilishlari kerak. Standart qimor usuli foydalilikni aniqlashning yana bir keng tarqalgan usuli hisoblanadi. Bu usulda bemorlarga ikkita variantdan qaysi birini afzal ko'rishlari so'raladi: yoki ma'lum bir ehtimollik (p) (t) bilan normal sog'lig'ida ma'lum bir yil yashaydi va 1-p ehtimollik bilan o'lim xavfini o'z zimmasiga oladi; Yoki o'zaro sog'liq sharoitida t yil yashashingizga ishonch hosil qiling. Bemorlardan har xil p-qiymatlari bo'yicha bir necha marta so'rang, shunda ular hech qanday variantni afzal ko'rmaydilar, shunda yordamni bemorning javoblari asosida hisoblash mumkin.
Bemorlarning individual imtiyozlarini aniqlash uchun qo'llaniladigan usullardan tashqari, bemorlar populyatsiyasi uchun foydali bo'lish usullari ham ishlab chiqilgan. Ayniqsa, fokus-guruh muhokamalari (muayyan tajribalarni muhokama qilish uchun bemorlarni bir joyga to'plash) ularning nuqtai nazarini tushunishga yordam beradi. Guruh foydasini samarali birlashtirish uchun turli tuzilgan guruh muhokamasi usullari taklif qilingan.
Amalda, klinik diagnostika va davolash jarayoniga yordamni bevosita joriy etish juda ko'p vaqt talab etadi. Yechim sifatida, so'rovnomalar odatda aholi darajasida foydali ballarni olish uchun tasodifiy tanlangan populyatsiyalarga taqsimlanadi. Ba'zi misollar orasida EuroQol 5 o'lchovli so'rovnomasi, 6 o'lchovli foydali vaznning qisqa shakli, Health Utility Index va Saratonga oid Evropa saraton tadqiqot va davolash tashkilotining hayot sifati so'rovnomasi Core 30 vositasi kiradi.


Xabar berish vaqti: 2024 yil 01-iyun