Pemrosesan Teks dengan Rapidminer - Seri Perkuliahan Data Analytic & Data Mining #10

Sdílet
Vložit
  • čas přidán 29. 11. 2021
  • Halo teman-teman semua. Pada video ini, kita belajar mengenai teknik pemrosesan teks. Teks yang kita gunakan pada tutorial ini bersumber dari media sosial Twitter. Pemrosesan teks tersebut berguna untuk menganalisis informasi penting ataupun kata-kata yang paling sering muncul/ disebut. Untuk dapat melakukan pemrosesan teks, kalian harus menginstall terlebih dahulu sebuah ekstensi bernama "Text Processing" pada menu Extensions.
    Tutorial instalasi extension tersebut dapat kalian tonton di sini: • Tutorial Instalasi Ext...
    Link unduh dokumen stopword Bahasa Indonesia: www.kaggle.com/oswinrh/indone...

Komentáře • 140

  • @erfinnurrohmakhakim9207
    @erfinnurrohmakhakim9207 Před 2 lety +1

    Alhamdulillah pernah ikut kuliah umum nya bapak dan sgt tertarik. Skg mata kuliah bigdata sgt terbantu dgn video2 bapak. Terima kasih pak

  • @anisuryani6433
    @anisuryani6433 Před 2 lety

    Terimakasih pak atas kontennya karna telah membantu saya

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      sama2 mbak. terima kasih juga sudah mampir ke channel saya. sukses selalu :)

  • @dhiaulfa8993
    @dhiaulfa8993 Před 6 měsíci

    Terima kasih kak, penjelasannya mudah dipahami

  • @nasrudinjaqin9072
    @nasrudinjaqin9072 Před rokem

    Ijin download buat belajar ya pak,, mkasih banyak 🙏

  • @naufalalfaiiz
    @naufalalfaiiz Před 2 lety +1

    Membatu sekali dalam mengerjakan tugas yang diberikan Bu Saucha heheheh

  • @satyautama09
    @satyautama09 Před 2 lety +1

    Selamat pgi pak ingin bertanya pak, kalo stopwords menggunakan 2 bahasa (Bahasa Inggris dana Indonesia) bagaimana pak?
    Mohon pencerahannya Terima Kasih

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      kamus kata stopwordsnya digabung dalam 1 file saja. Jadi 1 file itu berisi stopwords bahasa indonesia dan bahasa inggris.

  • @dovan9707
    @dovan9707 Před 2 lety

    Halo kak saya ingin bertanya , bagaimana cara convert file hasil crawling ke csv yang benar? Soalnya saat saya coba tadi hasilnya waktu dibuka di excel normal , tetapi saat saya buka di rapidminernya isi kolomnya menjadi tanda tanya ("? ") itu bagaimana ya solusinya terimakasih 🙏

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      oya, sepertinya saya belum sempat buat videonya :)
      caranya mudah, gunakan saja operator "Write CSV", lalu nanti kita siapkan dulu filenya lewat panel parameter di kanan atas. Simbol "?" itu muncuk karena ada data yang kosong (missing value), tidak ada nilainya. Jika dibuka di excel, data tersebut biasanya kosong (tidak ada isinya).

  • @Chylls_
    @Chylls_ Před rokem

    Halo pak, izin bertanya, berhubung rapidminer bisa menggunakan modul yg ada di python saya mo tanya cara gimana kita menghubungkan modul sastrawi ke rapidminer untuk stemming data. Soalnya rapidminer gapunya modul otomatis untuk stemming Indonesia 🥲 makasih

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Halo juga, kebetulan saya juga belum pernah memasukkan python ke rapidminer. Sementara ini saya melakukannya manual, data dari rapidminer sata masukkan ke python untuk distemming dengan sastrawi, lalu hasilnya saya kembalikan lagi ke rapidminer. Mohon maaf 😅🙏

  • @alvintata7525
    @alvintata7525 Před 2 lety +1

    Assalamu'alaikum izin bertanya pak, dataset saya sebelumnya 1500 tapi saat saya import write csv dirapid jadinya 1800 itu kira² masalahnya dimana pak?mohon bantuannya pak untuk tugas akhir saya🙏

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Wa'alaikumussalaam. Halo, maaf baru bisa balas. Kemungkinan di excelnya terdapat data kosong sampai baris ke 1800, sehingga ketika dibaca oleh rapidminer dia berisi 1800 record (yang nilainya kosong)

    • @ibuida7096
      @ibuida7096 Před rokem

      ​@@KuliahInformatikap

  • @febi1576
    @febi1576 Před 10 měsíci

    maaf pak ijin bertanya, bagaimana cara download file yang telah di proses tersebut ya pak? karna saya sudah coba dengan write csv namun saat di download filenya hanya berisi hasil tokenizenya data textnya tidak terbaca. mohon advicenya pak

    • @KuliahInformatika
      @KuliahInformatika  Před 10 měsíci

      yang mau didownload file yang mana? file twit mentah atau apa? semuanya bisa pakai write csv asalkan write csv nya dikoneksikan dengan tepat

  • @user-jt3wb3wy4g
    @user-jt3wb3wy4g Před rokem

    Assalamualaikum pak izin bertanya jika menggunakan metode klassifikasi SVM apakah pelabelannya diisi di semua data? dan bagaimana membagi persentase data latih dan data ujinya? semoga dibalas untuk keperluan tugas akhir, terimakasih 🙏

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Pada prinsipnya, apapun metode klasifikasinya, jika ingin membangun model yang optimal maka semua data harus dilabeli agar bisa diukur performanya. Persentase pembagian data latih dan uji tidaka ada aturan baku, yang jelas porsi data latih lebih besar dari data uji. Bisa pakai skema 70:30 atau 80:20.

  • @zmchannel07
    @zmchannel07 Před rokem +1

    Assalamualikum wr.wb
    mohon maaf mengganggu waktunya, boleh minta tolong pak? apakah boleh minta mentahan file crweling sirkuit mandalika, soalnya data saya hilang , dan ketika melakukan crwling untuk waktu tertentu tidak tampil

  • @jefinafina322
    @jefinafina322 Před 2 lety +1

    salam pak apakah dari awal atribut ID tidak ikut disimpan sehingga tidak gunakan select atribute? terimakasih

    • @mdawamuzzikri3187
      @mdawamuzzikri3187 Před 2 lety

      nitip

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Halo, maaf baru bisa balas komennya. Pada beberapa data di video, atribut ID sudah saya hapus manual dengan excel. Secara default, memang rapidminer selalu mengikutsertakan atribut ID pada data twitternya.

  • @hermila3386
    @hermila3386 Před 9 měsíci

    Pak Extension di RM saya khusus yg filtering cuma ada by dictionary.. tdk ada yg by lenght.. itu gmna yah pak ?

    • @KuliahInformatika
      @KuliahInformatika  Před 8 měsíci

      Coba disearch saja, ketik "filter by length", atau ketik saja "length", seharusnya ada. Atau kalau masih belum berhasil, coba install dulu ekstensi "Text Processing". Saya sudah sediakan video tutorial instalasinya, bisa disearch saja di channel 🙏

  • @riskaseptiani5958
    @riskaseptiani5958 Před 2 lety

    Pak, izin bertanya kalau menghapus hastag di rapidminer gimana ya? Apa pake replace juga?

  • @aguspriyatna2985
    @aguspriyatna2985 Před 5 měsíci

    Dari data read csv yang kotor tadi untuk melihat data setelah dibersihkan dimana ya ?

    • @KuliahInformatika
      @KuliahInformatika  Před 4 měsíci

      Dari video tersebut, pada operator 'Nominal to Text', tarik koneksi dari konektor 'exa' hubungkan ke 'res' di ujung kanan, lalu jalankan prosesnya (F11).

  • @whoismexon2066
    @whoismexon2066 Před 2 lety

    Gunawan here mantap pak👍👍👍

  • @lucreciakirana8202
    @lucreciakirana8202 Před 4 měsíci

    Pak cara save data menjadi csv dalam bentuk nama dan komentar bagaimana ya pak? bukan dalam bentuk data hasil tf-idf, soalnya waktu saya save dalam bentuk csv yang tersave adalah data tf-idf bukan data dalam bentuk nama dan komentar. mohon bantuannya pak, terima kasih.

    • @KuliahInformatika
      @KuliahInformatika  Před 4 měsíci

      Dari video tersebut, pada operator Nominal to Text, hubungkan konektor 'exa' ke operator 'Write CSV'. Klik dua kali operator Write CSV, tentukan lokasi dan nama data yang mau disimpan. Setelah selesai, klik Run (F11)

  • @parasamandaputri8024
    @parasamandaputri8024 Před 2 lety

    assalamualaikum pak, izin bertanya jika ingin memfilter emoticon bagaimana ya pak?terimakasih

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Setahu saya, di rapidminer dia otomatis memfilter emoticon (emoticon sdh tidak masuk ke data twit)

  • @novipermatadewi682
    @novipermatadewi682 Před 8 měsíci

    Permisi pak, izin bertanya. Gimana cara menghilangkan emoticon yg ada di data kita ya pak? Memakai operator apa?

    • @KuliahInformatika
      @KuliahInformatika  Před 8 měsíci

      pakai saja operator replace, nanti pada bagian "what to replace", isikan saja simbol2 yang mau dihapus (karena biasanya emoticon itu pakai simbol2 yang ada di keyboar), contoh: [:)(#@]

  • @ghinashalihah7417
    @ghinashalihah7417 Před 8 měsíci

    Assalamu'alaikum warahmatullah pak ijin bertanya saya kan ga sengaja nge x in panel parameter nya sehinggal panel parameter nya hilang bagaimana ya cara agar memunculkan nya lagi

    • @KuliahInformatika
      @KuliahInformatika  Před 8 měsíci

      Wa'alaikumussalaam. Masuk menu VIEW, lalu klik Restore Default View

  • @hermila3386
    @hermila3386 Před 10 měsíci

    Pak di RapidMiner saya gak ada operator Extensions dan Deployment .. gimana caranya kasi muncul ?🥲🙏

    • @KuliahInformatika
      @KuliahInformatika  Před 9 měsíci

      Operator "Extension" memang tidak ada. Extension itu ada di menu di bagian atas Rapidminer, itu untuk menginstall extension atau tools tambahan ke dalam Rapidminer kita.

  • @radartutorial3687
    @radartutorial3687 Před rokem

    Assalamuaaikum pa mau tanya, klo pengambilan datanya di ulasan googel play untuk prosesnya apakah sama atau tidak ya? Terimakasih🙏

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Wa'alaikumussalaam. Setahu saya, Rapidminer belum support untuk mengambil data dari google play. CMIIW

    • @radartutorial3687
      @radartutorial3687 Před rokem

      Boleh saya minta email nya untuk nanya nanya 😁

  • @arneshafebrasyavera8953
    @arneshafebrasyavera8953 Před 2 lety +1

    Assalamualaikum pak, terimakasih ilmunya saya sangat butuh untuk tugas akhir saya, jika saya ingin bertanya dan berkonsultasi boleh menghubungi lewat mana ya pak? terimakasih sebelumnya

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      wa'alaikumussalaam. alhamdulillaah, sama2 mbak. silakan kontak saya via email: muhammad.fachrie@staff.uty.ac.id

  • @ayobelajarbareng1744
    @ayobelajarbareng1744 Před 2 lety

    mau ambil dataset tweet mandalika nya di link mana ya pa? untuk prakteknya. terima kasih

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Oh ada di deskripsi video yang ini pak: czcams.com/video/yn49YAJCAnw/video.html

  • @nurannamuslimah8847
    @nurannamuslimah8847 Před 11 měsíci

    Hallo pak, sebelumnya terima kasih atas vt yang telah bapak buat karena sangat membantu saya
    Maaf pak saya mau bertanya, pas saya preprosessing text terus saya masukan tokenize pas dijalankan kok data saya tidak terbaca ya malah tidak ada sama sekali
    Kira kira knp ya pak

    • @KuliahInformatika
      @KuliahInformatika  Před 11 měsíci

      sepertinya ada koneksi operator yang keliru. coba dicek sekali lagi, pastikan koneksi operator sudah sesuai seperti di video

  • @ahlulwursitakumar8801

    izin tanya Pak, kalau data CSV yang diread ada error itu solve problemnya bagaimana ya Pak?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      coba dibaca dulu warningnya apa. biasanya dia kasih informasi ttg apa errornya. kalau memang masih bermasalah, coba dicek datanya di Ms. Excel, dilihat kira2 bagian mana yang kurang rapi

    • @ahlulwursitakumar8801
      @ahlulwursitakumar8801 Před rokem

      @@KuliahInformatika ketika sudah diberitahu informasi erronya, saya bisa lgsg perbaiki di RapidMiner atau hanya bs di Ms Excel Pak?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      @@ahlulwursitakumar8801 excel bisa, rapidminer bisa. tapi mending di excel biar lebih fleksibel

    • @ahlulwursitakumar8801
      @ahlulwursitakumar8801 Před rokem +1

      @@KuliahInformatika baik Pak terima kasih banyak, sehat selalu yaa Pak

  • @rinapatmawati7601
    @rinapatmawati7601 Před 2 lety

    Pak gimna caranya agar data repository itu berubah jadi read CSV?

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Pakai operator write csv untuk menyimpan data di repository menjadi csv

  • @syifarosa6500
    @syifarosa6500 Před rokem

    Pak mau tanya tombol parametrs saya kesilang . bagaimana cara balikinnya ??

  • @fitriani8697
    @fitriani8697 Před 2 lety

    Mohn pk link stopword bahasa. Csv dshere dsini so sy blm ktemu

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Oya bu, linknya sudah saya tambahkan di deskripsi video.
      Link unduh dokumen stopword Bahasa Indonesia: www.kaggle.com/oswinrh/indonesian-stoplist
      semoga bermanfaat 🙂

  • @kunamanuk
    @kunamanuk Před rokem

    ini sama saja kan ya untuk dataset csv ataupun excel?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Ya, dua-duanya bisa. Kalau filenya excel, pakai operator "Read Excel", kalau filenya CSV pakai operator "Read CSV"

  • @arizaeka1005
    @arizaeka1005 Před měsícem

    bang yang data ini kok gak ada yaaa? adanya yang data clean sirkuit mandalika boleh minta datasetnya untuk latihan

    • @KuliahInformatika
      @KuliahInformatika  Před měsícem

      silakan: utyac-my.sharepoint.com/:x:/g/personal/muhammad_fachrie_staff_uty_ac_id/EchiMgodARVPtVi9SLSpbeMBLXHfm8aySHovBTMFEYkWRA?e=or1EQD

  • @Ifanzzz
    @Ifanzzz Před rokem

    Jika sudah semua trus save nya gimana ya biar bisa di excel?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Pakai operator "Write Excel", nanti tentukan direktori dan nama file excelnya pada opetator tersebut

  • @satyautama09
    @satyautama09 Před 2 lety

    Selamat pagi pak ingin bertanya pak, kalo stemming dengan bahasa indonesia bagaimana caranya ya pak?

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      nah, ini sebenarnya belum support di operator bawaan Rapidminer mas. Saya belum ada video terkait itu. Sementara ini, stemming masih disupport kalo koding di Python memakai library Sastrawi

  • @veronikajulien8687
    @veronikajulien8687 Před rokem

    Mohon penjelasan kalau filter exampel nya eror gimana? 😢

  • @andreaspakpahan3271
    @andreaspakpahan3271 Před 2 lety

    assalamu'alaikum izin bertanya terkait stemming bapak, bagaimana ya kalau di rapidminer ? Terima kasih

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety +1

      Wa'alaikumussalaam. Nah ini kelemahan rapidminer untuk saat ini. Rapidminer hanya support stemming untuk bahasa inggris dan bahasa2 asing lain seperti jerman dll. Jika ingin melakukan stemming di rapidminer, strateginya adalah membuat kode python sendiri yang menggunakan stemming dari library seperti sastrawi, lalu kode python tersebut diimport ke rapidminer. ada operatornya utk membaca kode python di rapidminer

    • @andreaspakpahan3271
      @andreaspakpahan3271 Před 2 lety

      @@KuliahInformatika izin pak, kalau saya ada data terkait kata dasar yang setelah dihilangkan imbuhannya bagaimana pak ? apa bisa diinput di operator stemming (dictionary) nya ? izin arahan pak

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      @@andreaspakpahan3271 Bisa.

  • @nabatuu
    @nabatuu Před 10 měsíci

    pak izin bertanya, kali misakan mau mengahpus data yang ada emojinya gimana ya pak?

    • @KuliahInformatika
      @KuliahInformatika  Před 10 měsíci

      emoticon biasanya pakai simbol2. Untuk menghilangkannya bisa pakai operator "Replace", lalu karakter yang direplace bisa ditulis misalnya begini: [:()-=;'/|]

    • @nabatuu
      @nabatuu Před 10 měsíci

      @@KuliahInformatika terima kasih pak atas informasinya, saya akan praktikan langsung. Semoga bapak bisa diberikan kesehatan dan dapat berbagi ilmu yang bermanfaat

  • @devi_pd
    @devi_pd Před rokem

    Pak saya mau tanya kalau labeling itu stepnya sebelum text preprocessing atau setelahnya ya?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Lebih enak sebelum preprocessing, karena teksnya masih utuh, belum ada yang diubah/ dihapus. Tapi saran saya, lakukan penghapusan data yang duplikat dulu, baru lakukan labelling biar efisien.

    • @devi_pd
      @devi_pd Před rokem

      @@KuliahInformatika terimakasih pak atas jawabannya,kalau untuk step urutannya itu bagaimana ya pak saya masih bingung setelah scrapping data dr playstore -> labeling -> text preprocessing -> klassifikasi,visualisasi & perhitungan perfomansi atau bagaimana ya pak urutannya?🙏

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      @@devi_pd ya itu sudah benar mbak

    • @devi_pd
      @devi_pd Před rokem

      @@KuliahInformatika kalau untuk labeling datanya misalkan tidak termasuk positif / negatif itu bagaimana ya pak? Contohnya ulasan yg tidak jelas seperti "xzyy" gitu pak? Atau tidak usah diikutkan ulasan" yg seperti itu?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      @@devi_pd bisa dihapus saja jika isinya tidak jelas. Sentimen yang tidak masuk pos/ neg, bisa dimasukkan ke label "netral"

  • @FitrianiAni-hv3ij
    @FitrianiAni-hv3ij Před rokem

    Maaf izin bertanya pak 🙏
    Cara melakukan case folding gimna ya pak 🙏

  • @masterbarbar7841
    @masterbarbar7841 Před 8 měsíci

    maap pak apakah ada data csv mentahannya? saya mau pelajarin untuk datasetnya

    • @KuliahInformatika
      @KuliahInformatika  Před 8 měsíci

      Kalau tidak salah linknya sudah saya sediakan di deskripsi video ini. coba dicek ya

  • @muhlis9896
    @muhlis9896 Před 2 lety

    Assalamualaikum kak...
    Ngambil data di Rapidmanner ini durasi waktunya brapa lama k'?

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Wa'alaikumussalaam. Relatif sebentar. Sebagai gambaran, 500 data hanya butuh sekkitar 5 s.d. 10 detik. Saya juga pernah ambil 10.000 data sekaligus hanya dalam waktu kurang dari 1 menit. Tapi jika jumlah data yang diambil dala sekali pengambilan terlalu banyak, Twitter akan berhenti di tengah2 proses biasanya, karena ada batasan waktu dalam sekali pengambilan.

    • @muhlis9896
      @muhlis9896 Před 2 lety

      @@KuliahInformatika kemarin pake excel k' ambil datanya buat tugas kuliah, cuman kok datanya nggak ke ambil semua...kalau saya check" datanya, data yang bisa keambil itu cuman durasi 2 pekan k'
      Pusing mikirin tugas, masa harus copas satu satu twit 😭😭😭

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Ya, data twitter yang bisa kita ambil maksimal hingga 8 hari yang lalu. Jadi jika lebih dari itu, tidak bisa menggunakan operator yang ada di Rapidminer ini.

  • @Suryadana007
    @Suryadana007 Před 8 měsíci

    Bang cara labeling data harus manual bang?
    Apakah ada cara otomatisnya?

    • @KuliahInformatika
      @KuliahInformatika  Před 8 měsíci

      labeling itu pada dasarnya memang manual, dan itu memang pekerjaan yang menguras waktu. meskipun ada strategi lanjutan yang bisa membantu mengotomatisasi proses labeling, misalnya menggunakan strategi semi-supervised learning.

  • @justpervertman9100
    @justpervertman9100 Před 4 měsíci

    Ijin download buat belajar ya pak,, mkasih banyak 🙏. jika boleh, bisakah bapak juga menyertakan file stem word untuk bahasa indonesia pak ?

    • @KuliahInformatika
      @KuliahInformatika  Před 4 měsíci

      Silakan. semoga bermanfaat. BTW, file stem word saya tidak punya. Biasanya jika kita sudah menggunakan library seperti Sastrawi, sudah terintegrasi algoritma untuk melakukan stemming.

  • @yehudaary5519
    @yehudaary5519 Před rokem

    Maaf pak ijin bertanya cara membuat dataset nya gimana ya?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      dataset kita ambil dari histori/ kejadian/ transaksi yang pernah terjadi. Nilainya bukan dikarang2, tapi bedasarkan fakta. Setelah data terkumpul, kita tentukan satu kolom yang akan menjadi label

  • @dafaakbarfirmansyah4866

    Hallo ingin bertanya, untuk ekspor hasilnya bagaimana ya?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      ekspor datanya ya? cukup dengan menghubungkan koneksi ke operator "Write Excel" atau "Write CSV" (kedua operator tersebut dapat dicari di panel Operator)

    • @dafaakbarfirmansyah4866
      @dafaakbarfirmansyah4866 Před rokem

      @@KuliahInformatika menghubungkan nya di sub proses process document from data atau diluar?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      @@dafaakbarfirmansyah4866 di luar, di bagian akhir

  • @vinsentbrilianadiguna1632

    pak apakah ada link untuk stemming bhs indonesia??

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Kalau stemming biasanya saya pakai di python, pake library sastrawi utk bahasa indonesia. Videonya belum ada kalau di saya 😁

  • @dafaakbarfirmansyah4866

    Mau tanya, untuk menghapus emoticon itu bagaimana ya?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Kalau di rapidminer, emoticon sudah otomatis terfilter. Atau kalau mau memastikan lagi, replace saja simbol2 yang biasa dipakai untuk membuat emoticon, misalnya :, ), p, dst.

    • @dafaakbarfirmansyah4866
      @dafaakbarfirmansyah4866 Před rokem

      @@KuliahInformatika mau tanya lg pak
      Mengapa setiap kali import file csv pasti berantakan? Misalnya data awal berjumlah 300 tetapi setelah diimport bisa menjadi 500. Itu bagaimana ya pak mengatasi nya?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      @@dafaakbarfirmansyah4866 bukanya di excel ya? Kemungkinan ada baris2 yang sebetulnya kosong. Praktisnya, data mentahnya dirapikan dulu di Excel, baru setelah itu diproses di Rapidminer.

  • @farhandjannati936
    @farhandjannati936 Před 7 měsíci

    Inimodel apa bang prosesingnya,algoritma apa

    • @KuliahInformatika
      @KuliahInformatika  Před 7 měsíci

      in processing teks dasar saja mas, belum pakai algoritma tertentu seperti tf-idf. baru sebatas membersihkan data teksnya

  • @alfinsyahrina
    @alfinsyahrina Před rokem

    Mohon maaf pak, boleh minta dataset mentahnya, buat skripsi 🙏

  • @vindarjaya
    @vindarjaya Před měsícem

    Cara download csv hasil proses gimana ya pak?

    • @KuliahInformatika
      @KuliahInformatika  Před měsícem

      Pakai operator "Write CSV". Nanti konektor "exa" dr operator sebelumnya dikoneksikan saja ke Write CSV. Atau cara paling polos, copy paste saja data dari rapidminer ke excel.

    • @vindarjaya
      @vindarjaya Před měsícem

      @@KuliahInformatika tapi awalnya tetap pakai read csv ya pak?. Iya saya pakai copy paste tapi datanya terlalu banyak. Terima kasih pak

  • @kamaludinnoviyanto8589

    Izin belajar pak

  • @afriyantipanjaitan1303
    @afriyantipanjaitan1303 Před 2 lety +1

    Maaf pak izin bertanya, stemming nya tidak ada ya pak?

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      seperti yang saya sampaikan di video, rapidminer belum support text processing bahasa indonesia, maka kita harus siapkan dictionary stemmingnya secara manual. nah ini butuh waktu dan tenaga, makanya di video ini saya tidak menggunakan stemming. Sebenarny saya berencana membuatkan video tutorial stemming bahasa indonesia di rapidminer, tapi belum sempat 🙂

    • @afriyantipanjaitan1303
      @afriyantipanjaitan1303 Před 2 lety

      @@KuliahInformatika apakah hasil acuracy nya tetap sama atau meningkat jika ditambahkan proses stemming lagi pak?

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      @@afriyantipanjaitan1303 pertanyaan yang sangat bagus mbak 🙂👍
      Saya pribadi tidak yakin akurasinya akan meningkat signifikan, karena stemming akan bekerja dengan efektif jika bahasa yang digunakan itu baku. Nah, masalahnya, bahasa pengguna twitter itu kan sangat beragam, dan cenderung tidak pakai bahasa baku, banyak singkatan, bahasa slang, campuran bahasa daerah, dll. Itu menurut saya 🙂

    • @afriyantipanjaitan1303
      @afriyantipanjaitan1303 Před 2 lety

      @@KuliahInformatika baik, terima kasih pak.
      Mau nanya lagi ni pak untuk pembagian datanya saya buat 80% data latih dan 20% data uji, Nahh untuk data uji sebanyak 20% ini sudah ada pelabelan atau belum pak?
      Terima kasih pak.

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      @@afriyantipanjaitan1303 kalau ingin mengukur performanya, maka data uji harus dilabeli

  • @dadangsutisna4213
    @dadangsutisna4213 Před rokem

    Pa izin share Dataset Sirkuit Mandalika.csv 🙏

  • @mhmmdisya_putra2026
    @mhmmdisya_putra2026 Před 2 lety

    Assalamualaikum pak izin bertanya
    Kog di tempat saya saat mau memasukan proces document to text di operators ga muncul ya pak🙏

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Maksudnya mungkin "Process Document from Data" ya? Sudah install extension "Text Processing"?

    • @mhmmdisya_putra2026
      @mhmmdisya_putra2026 Před 2 lety +1

      @@KuliahInformatika ini barusan instal pak🙏

  • @syifarosa6500
    @syifarosa6500 Před rokem

    Pak mau tanya tombol parametrs saya kesilang . bagaimana cara balikinnya ??