Terdengar seperti ibu sungguhan, bukan brosur klinik
Balasan AI generik di Indonesia terdengar formal, jauh, dan klinis - kebalikan dari cara para ibu benar-benar saling bicara. Baibu dibangun agar terdengar seperti teman sebaya di WhatsApp: hangat, singkat, lokal, dan peka secara emosional.
Pertanyaan yang sama. Dua dunia yang berbeda.
Seorang ibu yang khawatir menanyakan hal yang sama dengan dua cara. Respons pertama adalah hasil asisten generik. Respons kedua adalah arah yang sedang kami bangun.
Terasa seperti selebaran. Tidak hangat. Tidak ada tindak lanjut. Ibu berhenti membalas.
Memvalidasi perasaan dulu. Langkah berikutnya praktis. Satu pertanyaan jelas. Ibu lanjut berbicara.
400.000 kata dari percakapan ibu sungguhan
Aset awal kami adalah korpus terkurasi dari percakapan WhatsApp autentik antara ibu-ibu Indonesia dan pendamping komunitas - dianonimkan, disetujui, dan diberi label. Inilah bahan sumber untuk semua langkah berikutnya.
Kata-kata dari percakapan WhatsApp peer-to-peer autentik antar ibu Indonesia.
Nama, lokasi, nomor telepon, klinik, dan cerita pribadi dibersihkan secara ketat sebelum apa pun digunakan.
Setiap giliran diberi label topik, emosi, niat, campuran bahasa, dan kualitas - mengubah chat menjadi data terstruktur.
Tujuannya bukan menyalin ibu tertentu. Tujuannya mempelajari register bersama: hangat, singkat, praktis, lokal.
Ajarkan lewat contoh, bukan lewat retraining
Alih-alih melakukan retraining model yang mahal, kami menunjukkan contoh yang tepat pada momen yang tepat - teknik yang disebut in-context learning. Ini lebih cepat, lebih murah, transparan, dan terus membaik seiring korpus bertumbuh.
Playbook
Panduan singkat yang dikurasi manual tentang bagaimana Baibu harus selalu terdengar - hangat, seperti teman sebaya, pesan singkat, mengakui perasaan sebelum memberi saran, mengajukan satu tindak lanjut yang jelas, dan tidak pernah terasa seperti selebaran. Panduan ini selalu menyertai setiap percakapan.
Kartu skenario
Pustaka berisi 10-30 kartu yang ditulis manual untuk situasi berulang - khawatir-anak-demam, pertanyaan-memalukan, stres-keluarga, peringatan-kesehatan-mendesak. Setiap kartu mengajarkan cara menangani momen spesifik itu.
Pustaka respons model
Ratusan contoh yang sudah disanitasi tentang "seperti apa balasan yang baik" - setiap contoh memasangkan pesan pengguna dengan respons hangat, lokal, dan singkat yang kami inginkan. Semuanya diberi label berdasarkan topik, emosi, urgensi, dan register bahasa.
contoh saat peluncuran
contoh dalam tahun pertama
ditampilkan ke model setiap giliran
Apa yang terjadi saat seorang ibu mengirim pesan
Setiap pesan masuk dipahami, dicocokkan, dan dijawab dalam beberapa ratus milidetik. Model tidak pernah melihat seluruh korpus - hanya potongan yang tepat untuk momen spesifik ini.
Memahami pesan
Mendeteksi campuran bahasa (Indonesia, Jawa, Sunda, code-switching), topik, emosi, dan apakah ini momen sensitif terhadap keamanan. Ini menjembatani input berdaya rendah menjadi pencocokan yang andal.
Pilih kartu skenario yang tepat
Satu atau dua kartu skenario dipilih - misalnya "khawatir anak demam" ditambah "triase medis". Kartu ini memberi tahu model cara menangani jenis momen ini secara spesifik.
Munculkan contoh yang relevan
Tiga sampai lima contoh yang dipilih cermat dari pustaka ditarik masuk - cocok dengan topik, emosi, register bahasa, dan urgensi. Beragam, tidak duplikat.
Susun balasan
Playbook, kartu, dan contoh disusun menjadi prompt ringkas. Model menulis respons baru - dengan suara yang sama seperti contoh, tanpa menyalinnya kata demi kata.
Apakah para ibu terus berbicara dengan kami?
Kealamian, kehangatan, dan kelokalan memang subjektif. Tapi ada satu sinyal yang menangkap semuanya sekaligus: apakah ibu mengirim pesan kedua.
Second-turn continuation rate
Jika Baibu terdengar seperti teman sebaya sungguhan, ibu membalas. Jika terdengar klinis, ia berhenti. Setiap perubahan prompt, kartu skenario, dan contoh diukur terhadap satu sinyal jujur ini.
Lebih banyak balasan =
lebih banyak percakapan = lebih banyak data = suara lebih baik
Kenapa mengajar lewat contoh mengalahkan retraining
Biaya awal lebih rendah
Tidak ada proses training GPU. Kami memakai model multibahasa open-weight yang sudah ada dan membentuk perilakunya lewat contoh - biaya iterasinya jauh lebih rendah.
Transparan & bisa diaudit
Untuk setiap balasan, kami bisa menunjukkan kartu skenario dan contoh mana yang digunakan. Output buruk dapat dilacak kembali ke contoh spesifik dan diperbaiki dalam hitungan menit, bukan bulan.
Membaik harian, bukan kuartalan
Menambah atau menghapus contoh bisa dilakukan instan. Sistem membaik setiap kali kontributor mengirim pesan - tanpa perlu retraining model.
Lebih aman untuk momen sensitif
Percakapan terkait kesehatan diarahkan melalui kartu keamanan khusus. Konten pribadi tidak pernah ditanam ke bobot model - tetap berada di lapisan data yang bisa diaudit dan dihapus.
AI yang benar-benar terdengar seperti komunitas yang dilayaninya.
Penyandang dana, peneliti, dan mitra klinis - mari bicara tentang merancang bersama cakupan skenario, kartu keamanan, atau set evaluasi.