Langing Academy Bootcamp Series:
NLP Text Processing Bootcamp Batch 1
Periode Bootcamp: 1 Mei 2023 – 31 Juli 2023
Tingkatkan skill di bidang NLP text processing untuk wujudkan penelitian NLP berkualitas dan persiapan karir di bidang AI dan data bersama instruktur dan mentor berpengalaman.
Periode Pendaftaran:
Pendaftaran early bird: 9 Maret 2023 – 7 April 2023
Pendaftaran reguler: 8 April 2023 – 30 April 2023
Tentang Langing Academy NLP Text Processing Bootcamp
Langing Academy NLP Text Processing Bootcamp adalah program pembelajaran intensif di bidang AI untuk meningkatkan skill peserta terkait materi NLP text processing. Mengutamakan kualitas dengan tetap memberikan harga yang sangat terjangkau, program ini dipersembahkan oleh Langing Academy untuk membantu Indonesia dalam memenuhi kebutuhan talenta AI Indonesia khususnya di bidang NLP text processing.
Mengusung task-oriented learning dengan kelas eksklusif (maksimal 10 siswa per kelas) yang dipaparkan oleh instruktur dan mentor yang mempunyai kepakaran dan pengalaman yang luas di bidang NLP, Langing Academy NLP Text Processing Bootcamp mengedepankan proses pembelajaran yang menyenangkan, kondusif, dan interaktif sehingga siswa dapat nyaman belajar dan cepat memahami materi yang diberikan.
Instruktur NLP Kami yang Berpengalaman
Apa Saja yang Akan Didapat dari Bootcamp Ini?
Ilmu Dari Instruktur & Mentor Berpengalaman
Semua instruktur dan mentor bootcamp Langing Academy diseleksi secara ketat untuk memastikan mereka memiliki kepakaran yang mendalam di bidangnya masing-masing.
Kelas Daring Eksklusif
Tidak seperti bootcamp lain yang memiliki kelas besar, kelas di bootcamp Langing dibatasi maksimal 10 siswa untuk mendorong proses pembelajaran yang kondusif dan interaktif.
Video Rekaman Kelas Daring
Berhalangan ikut kelas daring? Kejar ketertinggalan materi melalui video rekaman kelas daring. Video rekaman ini dapat ditonton berulangkali untuk memperdalam pemahaman terhadap materi yang diajarkan.
Proyek Portofolio Bersertifikat
Siswa akan mendapatkan 5 proyek portofilio bersertifikat untuk meningkatkan peluang mereka mendapatkan pekerjaan di bidang AI dan data.
Gratis Akses Langing Annotate
Ingin membangun dataset untuk mewujudkan penelitian impian? Dapatkan gratis akses ke Langing Annotate selama 6 bulan untuk mempercepat proses anotasi data Anda!
Lifetime Hiring Service
Seluruh siswa dan alumni Langing Academy akan tergabung dalam layanan hiring service selamanya untuk dapat dibantu mendapatkan pekerjaan terkait AI & Data yang diinginkan.
Kurikulum dan Silabus
Kurikulum Inti
Proyek Portofolio
Kelas Bonus
Silabus Lengkap
Introduction to NLP Researching and Engineering
- Memahami apa itu NLP, pembagian cabang ilmu NLP, dan sumber belajar NLP.
- Memahami perbedaan mendasar NLP di akademik dan industri.
- Mengetahui bagaimana cara meningkatkan portofolio NLP.
Dataset Collection and Building
- Memahami apa itu data collection and building, cara mengumpulkan data, dan sumber-sumber data penting untuk seorang NLP researcher/engineer.
- Memahami apa itu anotasi data dan bagaimana memperoleh hasil anotasi data yang valid.
- Memahami bagaimana cara memvalidasi sumber data terbuka untuk dapat dimanfaatkan.
- Memahami teknik data splitting untuk evaluasi dan validasi model (train-validation-test split vs cross-validation).
- Pengenalan sekilas mengenai Langing Annotate untuk anotasi data.
Essential Python and RegEx for NLP Text Processing
- Memahami tipe data Python dasar minimal yang harus dikuasai oleh seorang NLP researcher/engineer (string, numbers, list, tuple, dictionary, dll.).
- Memahami operasi Python dasar minimal yang harus dikuasai oleh seorang NLP researcher/engineer (aritmatika, logika, keanggotaan, indentitas, perbandingan, dll.).
- Memahami operasi dasar Regular Expression (RegEx) dasar minimal yang harus dikuasai oleh seorang NLP researcher/engineer (sub, match, find, split dll.).
- Mempraktikan library dasar, tipe data, dan operasi dasar Python dan RegEx untuk pengambilan/pemanggilan dan manipulasi dasar data teks (Pandas, Json, Pickle, Re, dll.).
Essential Text Preprocessing
- Memahami text preprocessing dasar minimal yang harus dikuasai untuk membangun model NLP beserta masing-masing kegunaan dan kelemahannya.
- Mengenalkan text preprocessing lanjutan yang mungkin nantinya diperlukan dalam meningkatkan performa model NLP.
- Mempraktikan library Python populer untuk text preprocessing (SpaCy, NLTK, Sastrawi, dll.).
- Mempraktikan membuat fungsi/library Python mandiri untuk text preprocessing.
Classical Feature Extraction for NLP Text Processing
- Memahami bentuk dasar tokenisasi dalam classical feature extraction (word based vs character based).
- Memahami teknik dasar konversi token menjadi vektor angka dalam classical feature extraction (frequency based vs weighting based).
- Memahami jenis-jenis classical feature extraction populer (word n-grams, character n-grams, lexicon dictionary, dan orthography).
- Mempraktikan ekstraksi fitur word n-grams dan character n-grams.
- Mempraktikan membuat fungsi/library mandiri untuk ekstraksi fitur lexicon dictionary dan ortography.
- Memahami dan mempraktikan teknik dasar feature selection untuk reduksi dimensi fitur.
- Memahami dan mempraktikan classical feature combination.
Word Embedding Feature Extraction for NLP Text Processing
- Memahami apa itu word embedding dan motivasi lahirnya hal tersebut.
- Memahami arsitektur Word2Vec sebagai salah satu classic word embedding terpopuler.
- Mempraktikan training from scratch Word2Vec.
- Mempraktikan pemanfaatan pre-trained Word2Vec (ekstrak word embedding, retraining, dll.).
- Memahami arsitektur BERT sebagai salah satu contextual word embedding terpopuler.
- Mempraktikan training from scratch BERT.
- Mempraktikan pemanfaatan pre-trained BERT (ekstrak word embedding, retraining, dll.).
Single-Label Text Classification on Document Level
- Memahami apa itu text classification on document level.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model klasifikasi teks single-label yang dibuat.
- Mempraktikan klasifikasi teks single-label dengan classic machine learning (training, testing, tuning, library wrapping).
- Mempraktikan klasifikasi teks single-label dengan classic deep learning (training, testing, tuning, library wrapping).
- Mempraktikan klasifikasi teks single-label dengan BERT-based model (training, testing, tuning, library wrapping).
- Memahami cara pelaporan dan analisis perbandingan hasil klasifikasi teks single-label dari beberapa model NLP.
Multi-Label Text Classification on Document Level
- Memahami apa itu multi-label text classification on document level.
- Memahami pendekatan yang dapat dilakukan untuk menyelesaikan permasalahan multi-label text classification on document level.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model klasifikasi teks multi-label yang dibuat.
- Mempraktikan klasifikasi teks multi-label dengan classic machine learning (training, testing, tuning, library wrapping).
- Mempraktikan klasifikasi teks multi-label dengan classic deep learning (training, testing, tuning, library wrapping).
- Mempraktikan klasifikasi teks multi-label dengan BERT-based model (training, testing, tuning, library wrapping).
- Memahami cara reporting dan analisis perbandingan hasil klasifikasi teks multi-label dari beberapa model NLP.
Span (Sequence) Classification
- Memahami apa itu span (sequence) classification.
- Memahami contoh-contoh span (sequence) classification (NER, PoS tagging, custom information extraction, dan explainable NLP).
- Memahami bentuk-bentuk format data tagging pada span (sequence) data annotation.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model span (sequence) classification yang dibuat.
- Mempraktikan span (sequence) classification dengan classic machine learning (training, testing, tuning, library wrapping).
- Mempraktikan span (sequence) classification dengan classic deep learning (training, testing, tuning, library wrapping).
- Mempraktikan span (sequence) classification dengan BERT-based model (training, testing, tuning, library wrapping).
- Memahami cara reporting dan analisis perbandingan hasil span (sequence) classification dari beberapa model NLP.
Topic Modeling
- Memahami apa itu topic modeling.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model topic modeling yang dibuat.
- Mempraktikan topic modeling dengan LDA (training, testing, tuning, library wrapping).
- Mempraktikan topic modeling dengan LDA2Vec (training, testing, tuning, library wrapping).
- Mempraktikan topic modeling dengan BERT-based model (training, testing, tuning, library wrapping).
- Memahami cara pelaporan dan story telling dari hasil topic modeling.
Text Summarization
- Memahami apa itu extractive text summarization.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model extraxtive text summarization yang dibuat.
- Mempraktikan extractive text summarization dengan text-rank-based model (testing, tuning, library wrapping).
- Memahami apa itu abstractive text summarization.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model abstractive text summarization yang dibuat.
- Mempraktikan abstractive text summarization dengan BERT-based model (training, testing, tuning, library wrapping).
Text Translation
- Memahami apa itu statistical text translation.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model statistical text translation yang dibuat.
- Mempraktikan statistical text translation dengan phrase-based model (training, testing, tuning, library wrapping).
- Memahami apa itu neural text translation.
- Memahami penggunakan metrik evaluasi dan teknik validasi signifikansi yang sesuai dengan tujuan model neural text translation yang dibuat.
- Mempraktikan neural text translation dengan BERT-based model (training, testing, tuning, library wrapping).
Pada proyek portofolio ini, siswa akan diberikan tantangan untuk mengerjakan real-world NLP task menggunakan open dataset yang telah dipublikasikan resmi di konferensi NLP/computer science. Siswa akan diberikan tantangan ekstra berupa tambahan aturan seperti pemberian kustom parameter, kustom library output structure, dan lain sebagainya.
Secara umum, tujuan utama dari proyek portofolio ini adalah agar siswa dapat membuat suatu pre-trained NLP model yang dibungkus siap pakai selayaknya NLP researcher/engineer yang mengirimkan hasil kerjanya ke developer/production engineer.
Aspect-based Sentiment Analysis on Indonesian Restaurant Review
Bertujuab untuk menerapkan pengetahuan klasifikasi teks yang sudah dipelajari pada real-world case.
Named Entity Recognition on Indonesian News
Bertujuan untuk menerapkan pengetahuan span (sequence) classification yang sudah dipelajari pada data real-world case.
Hierarchical Sentiment and Topic Modeling on Indonesian Fintech Review
Bertujuan untuk menerapkan pengetahuan klasifikasi teks dan topic modeling yang sudah dipelajari pada real-world case.
Text Summarization on Indonesian News
Bertujuan untuk menerapkan pengetahuan text summarization yang sudah dipelajari pada real-world case.
Cross-domain Indonesian-English Machine Translation
Bertujuan untuk menerapkan pengetahuan machine translation yang sudah dipelajari pada real-world case.
Siswa dengan hasil proyek excelent berkesempatan dibimbing mempublikasikan hasil kerjanya di jurnal/konferensi NLP/computer science dengan biaya publikasi/registrasi ditanggung oleh Langing Academy!
Searching Like a Pro: Essential Querying Techniques in Search Engine and ChatGPT to Support Our NLP Career
- Memperdalam pemahaman bagaimana mencari open dataset yang berkualitas di internet untuk NLP researching/engineering.
- Memahami teknik penting dalam mencari fungsi/operasi Python untuk NLP researching/ engineering.
- Memahami teknik penting dalam mencari solusi ketika menemui bug/error dalam NLP researching/ engineering.
- Memahami teknik penting untuk memperoleh solusi cepat dari ChatGPT dalam NLP researching/ engineering.
Exploiting Pre-trained Models to Fasten NLP Engineering Process
- Memahami pentingnya pemanfaatan pre-trained model untuk mempercepat proses NLP engineering terutama dalam hal pembuatan proof of concept (PoC) ke calon klien.
- Memahami teknik pencarian pre-trained model di HuggingFace dan internet secara umum.
- Mempraktikan pemanfaatan pre-trained model dari HuggingFace.
- Mempraktikan pemanfaatan kombinasi beberapa pre-trained model dari HuggingFace untuk task yang cukup kompleks.
Becoming a Professional NLP Researcher and Engineer: Portfolio Preparation
- Memahami cara membuat dan publikasi proyek NLP mandiri.
- Memahami cara mengikuti shared-task/kompetisi NLP.
- Memahami cara menata profil GitHub.
- Memahami cara menata profil LinkedIn.
Becoming a Professional NLP Researcher and Engineer: Finding NLP-related Jobs and Preparing CV and Interview/Test
- Mengenal beberapa perusahaan di Indonesia yang mengembangkan/menggunakan teknologi NLP.
- Memahami cara mencari remote opportunity terkait NLP-related jobs di LinkedIn dan media lainnya.
- Mamahi cara mempersiapkan CV sesuai dengan perusahaan yang dituju.
- Memahami cara mempersiapkan interview/test sesuai dengan perusahaan yang dituju.
Untuk infomasi, kurikulum, dan jadwal pertemuan selengkapnya, silahkan request silabus ke Lamin (Langing Admin) melalui WhatsApp dengan klik tombol berikut:
Pendaftaran
Early Bird Price
Nikmati diskon Rp500.000,- sehingga kamu cukup membayar Rp3.400.000,- untuk mengikuti bootcamp NLP text processing super lengkap ini! Terbatas hanya sampai 7 April 2023!
Regular Price
Dapatkan pengetahuan NLP text processing super lengkap ini hanya dengan membayar Rp3.900.000,-! Pendaftaran dibuka sampai 30 April 2023, akan ditutup lebih awal jika kuota sudah terpenuhi!
Kupon Diskon
Kamu peserta salah satu kelas #NgabuburAI? Selamat, kamu berhak mendapatkan ekstra diskon Rp900.000,- !
Frequently Asked Questions (FAQ)
Apakah harus bisa programming?
Tidak. Bootcamp ini akan mengajarkan dari hal yang paling mendasar, yaitu instalasi Python itu sendiri.
Apakah program ini hanya untuk mahsiswa?
Tidak. Siapapun yang ingin mempelajari dan mengembangkan skill di bidang NLP text processing dapat mengambil bootcamp ini.
Apakah ada jaminan mendapatkan pengalaman kerja?
Ya. Top 10% dari peserta bootcamp ini berkesempatan mendapatkan jaminan disalurkan program internship di perusahaan yang mengembangkan/ menggunakan teknologi AI.
Apakah siswa yang lain dapat dibantu mendapatkan kerja?
Tentu. Semua siswa dan alumni akan masuk ke database hiring service Langing Academy sehingga selalu dapat dibantu untuk memperoleh perkejaan di bidang AI dan data yang diinginkan.
Apakah 1-on-1 mentoring hanya dibolehkan pada masa diskusi proyek?
Tidak. Siswa dapat request 1-on-1 mentoring sebanyak yang dibutuhkan dengan jadwal sesuai kesepakatan dengan mentor.
Bagaimana jika tidak dapat mengikuti suatu pertemuan kelas?
Anda dapat mengikuti sesi kelas lain yang tersedia. Apabila tidak memungkinkan, Anda dapat melihat recording pertemuan dan membuat rangkuman sebagai bukti Anda mengikuti materi.
Konsultasi Pendaftaran
Masih ada yang diragukan dan ingin ditanyakan? Jangan ragu untuk konsultasikan permasalahanmu dengan Lamin (Langing Admin) melalui WhatsApp dengan klik tombol berikut: