BELAJAR KOMPUTER

Baik! Berikut adalah 20 soal pilihan ganda tentang “Menerapkan Proses Komputasi untuk Data Bersih” — mencakup konsep pengolahan data, pembersihan data, dan etika AI, lengkap dengan opsi jawaban (a–e) serta pembahasannya.
Soal disusun dengan tingkat kesulitan:

5 mudah
10 sedang
5 sulit
Formatnya menyerupai soal UNBK/Asesmen Nasional.

🟢 Bagian A – Soal Mudah (5 Soal)

1. Yang dimaksud dengan data kotor adalah....
a. Data yang diambil secara manual
b. Data yang belum diolah dan mengandung kesalahan atau ketidakteraturan
c. Data yang tidak memiliki nilai numerik
d. Data hasil analisis
e. Data yang sudah dibersihkan dari duplikasi

Jawaban: b
Pembahasan:
Data kotor berarti data yang masih mentah, belum konsisten, mengandung kesalahan, atau formatnya tidak seragam.

2. Berikut ini yang termasuk contoh data tidak seragam adalah....
a. 2000 kcal, 2100 kcal, 2200 kcal
b. 1800, 2000 kcal, dua ribu seratus
c. 1500 kcal, 1600 kcal, 1700 kcal
d. Semua data dalam format angka
e. Data yang sudah dalam bentuk tabel

Jawaban: b
Pembahasan:
“1800, 2000 kcal, dua ribu seratus” memiliki format berbeda (angka dan teks).

3. Proses mengubah data yang tidak seragam menjadi format yang sama disebut....
a. Data mining
b. Data collection
c. Data cleaning
d. Data classification
e. Data visualization

Jawaban: c
Pembahasan:
Data cleaning adalah proses pembersihan data agar seragam dan siap dianalisis.

4. Mengapa AI tidak dapat bekerja dengan baik jika data pelatihannya kotor?
a. Karena AI tidak butuh data
b. Karena data kotor membuat hasil prediksi menjadi tidak akurat
c. Karena AI tidak bisa membaca angka
d. Karena AI hanya bekerja dengan teks
e. Karena data kotor memperlambat komputer

Jawaban: b
Pembahasan:
Data yang tidak bersih menghasilkan output yang salah (garbage in, garbage out).

5. Langkah pertama sebelum melatih model AI adalah....
a. Menentukan warna tampilan aplikasi
b. Melatih AI dengan data acak
c. Membersihkan dan mempersiapkan data
d. Menghapus semua data lama
e. Mengubah data menjadi teks

Jawaban: c
Pembahasan:
Data harus bersih dan terstruktur sebelum digunakan untuk pelatihan AI.

🟡 Bagian B – Soal Sedang (10 Soal)

6. Berikut ini yang termasuk kesalahan format pada data adalah....
a. 2000 kcal
b. 2100 kcal
c. dua ribu seratus
d. 1800 kcal
e. 1950 kcal

Jawaban: c
Pembahasan:
“dua ribu seratus” adalah teks, bukan angka, sehingga formatnya tidak konsisten.

7. Dalam dataset konsumsi kalori:
1800 kcal, 2000 kcal, 2200 kcal, 1800 kcal, 5000 kcal, 1950 kcal,
data 5000 kcal dianggap....
a. Data valid
b. Data tidak wajar (outlier)
c. Data hilang
d. Data bersih
e. Data teks

Jawaban: b
Pembahasan:
5000 kcal jauh berbeda dari rata-rata, sehingga disebut outlier.

8. Tujuan utama dari proses data cleaning adalah....
a. Membuat data terlihat menarik
b. Menghapus seluruh data lama
c. Menghasilkan data yang akurat, konsisten, dan siap digunakan
d. Mengganti data dengan angka acak
e. Mengubah data menjadi grafik

Jawaban: c
Pembahasan:
Tujuan data cleaning adalah menyiapkan data agar akurat, seragam, dan dapat dipercaya.

9. Ketika terdapat nilai kosong (missing value) dalam dataset, tindakan yang tidak tepat adalah....
a. Menghapus nilai kosong
b. Mengisi dengan nilai rata-rata
c. Mengabaikan nilai kosong tanpa alasan
d. Menyimpulkan pola dari data lain
e. Memeriksa penyebab data kosong

Jawaban: c
Pembahasan:
Mengabaikan nilai kosong tanpa pertimbangan dapat menyebabkan bias dan kesalahan analisis.

10. Pernyataan “Garbage In, Garbage Out” berarti....
a. Data yang bersih menghasilkan kesalahan
b. Data yang buruk akan menghasilkan hasil yang buruk juga
c. AI selalu benar walaupun datanya salah
d. AI dapat memperbaiki data kotor sendiri
e. Tidak perlu membersihkan data sebelum analisis

Jawaban: b
Pembahasan:
Jika data input salah, maka output AI juga akan salah.

11. Salah satu contoh bias data adalah....
a. Data diambil dari beragam kelompok masyarakat
b. Data hanya dikumpulkan dari satu kelompok tertentu
c. Data sudah melalui proses normalisasi
d. Data disimpan dalam format CSV
e. Data memiliki satuan yang seragam

Jawaban: b
Pembahasan:
Jika data tidak mewakili semua kelompok, hasil AI akan bias atau tidak adil.

12. Dalam konteks etika pengumpulan data, hal pertama yang harus diperhatikan adalah....
a. Desain tampilan data
b. Izin dari pemilik data
c. Kecepatan akses data
d. Format penyimpanan data
e. Ukuran file data

Jawaban: b
Pembahasan:
Etika pengumpulan data menekankan pentingnya izin dan privasi pengguna.

13. Data berikut:
1800 kcal, 2000 kcal, 2200 kcal, 1800 kcal, 2100 kcal, 1950 kcal, 1700 kcal, 2500 kcal, 2300 kcal, 1850 kcal
Termasuk jenis data....
a. Kualitatif nominal
b. Kualitatif ordinal
c. Kuantitatif kontinu
d. Kuantitatif diskrit
e. Data teks

Jawaban: c
Pembahasan:
Kalori adalah data numerik dengan nilai kontinu (bisa pecahan atau rentang).

14. Jika data memiliki satuan yang berbeda (misalnya kcal dan kJ), langkah yang tepat adalah....
a. Menghapus salah satu satuan
b. Membiarkan saja
c. Mengonversi semua ke satu satuan yang sama
d. Mengganti angka menjadi teks
e. Membulatkan semua nilai

Jawaban: c
Pembahasan:
Semua data harus seragam dalam satuan agar bisa dibandingkan dan dihitung dengan benar.

15. Dalam proses data cleaning, normalisasi data berarti....
a. Menghapus semua data duplikat
b. Menyamakan skala nilai agar mudah diproses
c. Mengubah data menjadi grafik
d. Menyimpan data ke cloud
e. Mengonversi data teks menjadi angka

Jawaban: b
Pembahasan:
Normalisasi mengubah skala data ke rentang tertentu agar perbandingan lebih konsisten.

🔴 Bagian C – Soal Sulit (5 Soal)

16. Jika suatu dataset memiliki 10% data yang hilang, strategi terbaik untuk menjaga akurasi model adalah....
a. Menghapus semua data
b. Mengisi nilai yang hilang menggunakan rata-rata atau median
c. Mengganti semua dengan nol
d. Mengabaikan data tersebut
e. Mengisi dengan nilai maksimum

Jawaban: b
Pembahasan:
Mengisi missing value dengan rata-rata atau median menjaga kestabilan distribusi data.

17. Berikut ini yang bukan termasuk tahap dalam proses pengolahan data adalah....
a. Pengumpulan data
b. Pembersihan data
c. Pengolahan dan analisis
d. Penyimpanan data
e. Penghapusan seluruh data

Jawaban: e
Pembahasan:
Penghapusan seluruh data bukan bagian dari pengolahan, melainkan tindakan ekstrem yang justru merusak dataset.

18. Dalam kasus AI rekomendasi makanan, data kalori yang salah input (contoh: 50000 kcal) sebaiknya....
a. Dibiarkan agar AI belajar dari kesalahan
b. Diganti dengan rata-rata data normal
c. Dihapus atau dikoreksi sesuai konteks
d. Dijadikan contoh khusus
e. Diperbanyak agar seimbang

Jawaban: c
Pembahasan:
Outlier ekstrem harus dihapus atau diperbaiki agar tidak memengaruhi pola model.

19. Jika AI dilatih dengan data yang bias terhadap jenis kelamin tertentu, dampak etis yang mungkin terjadi adalah....
a. AI menjadi lebih akurat
b. AI menghasilkan keputusan diskriminatif
c. AI lebih efisien
d. AI bebas dari kesalahan
e. AI berhenti bekerja

Jawaban: b
Pembahasan:
Bias data dapat membuat AI bersikap tidak adil, misalnya hanya akurat untuk satu kelompok.

20. Dalam pembuatan sistem AI, mengapa validasi data sangat penting setelah proses cleaning selesai?
a. Untuk memastikan model berjalan cepat
b. Untuk mengecek apakah data benar-benar siap digunakan dan bebas kesalahan
c. Untuk menghitung waktu pelatihan
d. Agar file data menjadi lebih kecil
e. Untuk menghapus data lama

Jawaban: b
Pembahasan:
Validasi data memastikan bahwa proses cleaning berhasil dan data siap digunakan untuk melatih model AI.

Bagian A. Soal Mudah (5 Soal)

Soal 1

Literasi:
Seorang siswa mencatat data konsumsi kalori teman-temannya: 1800 kcal, 2000, 2200 kcal, dua ribu tiga ratus, 1950.
Namun, guru menjelaskan bahwa data tersebut tidak seragam.

Pertanyaan:
Apa masalah utama dari data di atas?
a. Data sudah lengkap tetapi belum diberi label
b. Data terdiri dari angka dan teks, tidak seragam formatnya
c. Semua data sudah dalam format yang sama
d. Data terlalu sedikit
e. Data tidak memiliki satuan

Jawaban: b
Pembahasan:
Sebagian data berbentuk teks (“dua ribu tiga ratus”) dan sebagian berbentuk angka, sehingga formatnya tidak seragam.

Soal 2

Literasi:
Dalam pengumpulan data suhu harian, seorang peneliti menulis: 30°C, 29°C, tiga puluh satu, 28°C.

Pertanyaan:
Langkah yang perlu dilakukan agar data dapat diolah dengan benar adalah....
a. Menghapus data 28°C
b. Mengubah semua data ke format angka
c. Mengubah semua data menjadi teks
d. Menghapus data tertinggi
e. Mengganti semua data dengan rata-rata

Jawaban: b
Pembahasan:
Data harus seragam dalam bentuk numerik agar bisa diolah oleh komputer.

Soal 3

Literasi:
Seorang pengembang AI ingin membuat sistem pendeteksi makanan sehat. Namun, datanya tidak konsisten karena satuan berbeda (kcal dan kJ).

Pertanyaan:
Mengapa data perlu dikonversi ke satuan yang sama?
a. Agar tampilan tabel rapi
b. Agar mudah dihitung dan dibandingkan
c. Agar file menjadi kecil
d. Agar semua data menjadi teks
e. Agar data lebih beragam

Jawaban: b
Pembahasan:
Keseragaman satuan penting agar perbandingan antar nilai valid dan akurat.

Soal 4

Literasi:
AI tidak dapat memahami teks seperti “dua ribu tiga ratus” secara langsung tanpa proses konversi.

Pertanyaan:
Apa yang harus dilakukan agar AI dapat memahami nilai tersebut?
a. Menghapus data tersebut
b. Mengubah teks menjadi angka 2300
c. Menambahkan data baru
d. Membiarkan AI memperbaiki sendiri
e. Menyimpan data dalam bentuk teks

Jawaban: b
Pembahasan:
AI memerlukan input numerik yang bisa diolah secara matematis, bukan teks.

Soal 5

Literasi:
Ungkapan yang sering digunakan dalam dunia AI adalah “Garbage In, Garbage Out.”

Pertanyaan:
Arti dari ungkapan tersebut adalah....
a. Data bersih menghasilkan hasil buruk
b. Data kotor akan menghasilkan hasil yang salah
c. Data apa pun tidak memengaruhi hasil
d. AI bisa memperbaiki data kotor sendiri
e. Data kotor tidak berpengaruh

Jawaban: b
Pembahasan:
Kualitas hasil AI bergantung langsung pada kualitas data masukan.

🟡 Bagian B. Soal Sedang (10 Soal)

Soal 6

Literasi:
Dataset konsumsi kalori berikut digunakan untuk melatih AI:
1800 kcal, 2000 kcal, 2200 kcal, 1800 kcal, 5000 kcal, 1950 kcal.

Pertanyaan:
Nilai 5000 kcal termasuk....
a. Nilai normal
b. Outlier (nilai ekstrem)
c. Nilai rata-rata
d. Nilai kosong
e. Nilai teks

Jawaban: b
Pembahasan:
5000 kcal jauh dari rata-rata nilai lainnya, sehingga tergolong outlier.

Soal 7

Literasi:
Dalam tabel data siswa, beberapa entri nama dan nilai tercatat dua kali.

Pertanyaan:
Masalah tersebut disebut....
a. Data kosong
b. Data duplikat
c. Data bias
d. Data valid
e. Data tidak wajar

Jawaban: b
Pembahasan:
Data duplikat adalah data yang muncul lebih dari sekali dan perlu dihapus.

Soal 8

Literasi:
Sebelum data digunakan untuk melatih AI, peneliti melakukan pembersihan agar semua nilai seragam dan valid.

Pertanyaan:
Kegiatan tersebut disebut....
a. Data mining
b. Data cleaning
c. Data encryption
d. Data modeling
e. Data visualization

Jawaban: b
Pembahasan:
Data cleaning adalah proses pembersihan data agar siap digunakan untuk pelatihan AI.

Soal 9

Literasi:
Seorang peneliti mendapati beberapa kolom nilai yang kosong (missing value) dalam dataset.

Pertanyaan:
Cara yang tepat untuk mengatasinya adalah....
a. Menghapus semua data
b. Mengabaikan saja
c. Mengisi nilai kosong dengan rata-rata
d. Mengganti dengan nol tanpa alasan
e. Membiarkan AI memperbaikinya sendiri

Jawaban: c
Pembahasan:
Imputasi dengan nilai rata-rata menjaga keseimbangan distribusi data.

Soal 10

Literasi:
AI yang dilatih menggunakan data hanya dari satu kelompok masyarakat sering menghasilkan keputusan yang tidak adil.

Pertanyaan:
Masalah tersebut dikenal sebagai....
a. Kesalahan sistem
b. Bias data
c. Duplikasi
d. Outlier
e. Missing value

Jawaban: b
Pembahasan:
Bias data terjadi ketika data tidak mewakili keberagaman populasi.

Soal 11

Literasi:
Dalam survei online, peneliti meminta izin kepada peserta sebelum menggunakan data mereka.

Pertanyaan:
Langkah tersebut termasuk dalam aspek....
a. Normalisasi data
b. Etika pengumpulan data
c. Pembersihan data
d. Validasi data
e. Visualisasi data

Jawaban: b
Pembahasan:
Mendapatkan izin adalah bagian dari etika dalam pengumpulan data pribadi.

Soal 12

Literasi:
Data konsumsi kalori: 1800 kcal, 1950 kcal, 2100 kcal, 2300 kcal.

Pertanyaan:
Jenis data tersebut termasuk....
a. Kualitatif nominal
b. Kualitatif ordinal
c. Kuantitatif kontinu
d. Kuantitatif diskrit
e. Deskriptif

Jawaban: c
Pembahasan:
Kalori berupa nilai numerik dengan kemungkinan nilai pecahan, termasuk data kontinu.

Soal 13

Literasi:
Setelah data dibersihkan, dilakukan proses untuk memastikan tidak ada kesalahan tersisa.

Pertanyaan:
Proses ini disebut....
a. Validasi data
b. Normalisasi data
c. Penghapusan data
d. Pencarian data
e. Enkripsi data

Jawaban: a
Pembahasan:
Validasi data dilakukan untuk memastikan data sudah siap digunakan.

Soal 14

Literasi:
Dalam dataset berat badan: 50 kg, 51 kg, 500 kg, 52 kg.

Pertanyaan:
Langkah terbaik terhadap nilai “500 kg” adalah....
a. Dibiarkan
b. Dianggap rata-rata
c. Dihapus atau dikoreksi
d. Dikonversi ke teks
e. Ditambahkan data baru

Jawaban: c
Pembahasan:
Nilai 500 kg adalah outlier ekstrem yang perlu dihapus atau diperbaiki.

Soal 15

Literasi:
Pada proses data cleaning, semua nilai diubah ke skala 0–1 agar perbandingan antarvariabel adil.

Pertanyaan:
Langkah tersebut disebut....
a. Normalisasi data
b. Validasi data
c. Penghapusan data
d. Enkripsi data
e. Konversi data

Jawaban: a
Pembahasan:
Normalisasi menyamakan skala data agar analisis tidak bias oleh perbedaan besar nilai.

Soal 16

Literasi:
Seorang siswa menulis “2100 kcal” tanpa spasi (2100kcal) dalam tabel data.

Pertanyaan:
Masalah tersebut termasuk kategori....
a. Kesalahan format
b. Kesalahan satuan
c. Outlier
d. Data kosong
e. Bias

Jawaban: a
Pembahasan:
Format data tidak konsisten, karena satuan dan angka tidak dipisahkan dengan benar.

🔴 Bagian C. Soal Sulit (5 Soal)

Soal 17

Literasi:
Dalam dataset, 10% data hilang karena kesalahan sensor. Peneliti ingin tetap mempertahankan jumlah data agar model AI akurat.

Pertanyaan:
Langkah yang paling tepat dilakukan adalah....
a. Menghapus seluruh dataset
b. Mengisi data hilang dengan nilai median
c. Membiarkan data kosong
d. Mengganti dengan nilai maksimum
e. Menambah data acak

Jawaban: b
Pembahasan:
Imputasi dengan nilai median mengurangi distorsi tanpa menghapus data.

Soal 18

Literasi:
AI dilatih menggunakan data dari 80% responden laki-laki dan 20% perempuan.

Pertanyaan:
Kemungkinan dampak dari kondisi tersebut adalah....
a. Model AI menjadi netral
b. Model AI cenderung bias terhadap laki-laki
c. Model AI tidak bisa berjalan
d. Model AI lebih cepat dilatih
e. Tidak ada pengaruh

Jawaban: b
Pembahasan:
Data tidak seimbang dapat menimbulkan bias terhadap kelompok dominan.

Soal 19

Literasi:
Setelah membersihkan data, pengembang menemukan perbedaan format angka desimal antara titik (.) dan koma (,).

Pertanyaan:
Tindakan yang harus dilakukan adalah....
a. Menghapus semua data
b. Menyamakan format desimal seluruh data
c. Membiarkan saja
d. Mengganti semua angka menjadi teks
e. Menghapus nilai desimal

Jawaban: b
Pembahasan:
Format desimal harus konsisten agar AI tidak salah membaca nilai numerik.

Soal 20

Literasi:
Sebuah perusahaan AI mengumpulkan data pelanggan tanpa izin, kemudian menggunakannya untuk iklan.

Pertanyaan:
Tindakan tersebut melanggar prinsip....
a. Efisiensi data
b. Etika dan privasi data
c. Normalisasi data
d. Validasi data
e. Keamanan file

Jawaban: b
Pembahasan:
Menggunakan data tanpa izin adalah pelanggaran terhadap etika dan privasi pengguna.

SOAL MUDAH (1–5)

Soal 1 (Mudah)

Narasi:
Di kelas informatika, guru meminta siswa menjelaskan apa yang dimaksud dengan data kompleks. Sinta menjawab bahwa data kompleks adalah data yang memiliki beberapa komponen saling terkait.

Pertanyaan:
Pernyataan Sinta benar karena data kompleks …
A. Hanya berisi angka dan teks
B. Terdiri dari beberapa elemen yang saling berhubungan
C. Tidak dapat diolah oleh komputer
D. Selalu berbentuk gambar dan video
E. Hanya digunakan dalam program besar

✅ Jawaban: B
🧠 Pembahasan: Data kompleks terdiri dari banyak elemen seperti biodata (nama, kelas, alamat). Ini menunjukkan hubungan antarbagian data.
📖 Literasi: Menafsirkan makna istilah teknis dalam konteks digital.

Soal 2 (Mudah)

Narasi:
Guru memberikan contoh biodata siswa yang terdiri dari nama, kelas, tanggal lahir, dan alamat.

Pertanyaan:
Mengapa biodata disebut data kompleks?
A. Karena berisi angka
B. Karena data tidak memiliki hubungan
C. Karena terdiri dari beberapa elemen yang berbeda
D. Karena tersimpan dalam satu kolom
E. Karena selalu berubah setiap hari

✅ Jawaban: C
🧠 Pembahasan: Biodata merupakan gabungan beberapa elemen yang berbeda namun saling berkaitan.
📖 Literasi: Menghubungkan konsep abstrak dengan contoh nyata.

Soal 3 (Mudah)

Narasi:
Dalam program toko online, setiap produk memiliki nama, harga, deskripsi, stok, dan gambar.

Pertanyaan:
Elemen harga pada data produk termasuk tipe data …
A. String
B. Boolean
C. Numerik
D. Teks
E. Date

✅ Jawaban: C
🧠 Pembahasan: Harga diwakili oleh angka, sehingga tergolong tipe data numerik.
📖 Literasi: Mengenali hubungan antara jenis data dan penggunaannya.

Soal 4 (Mudah)

Narasi:
Dalam pemrograman Python, fungsi len() digunakan oleh siswa untuk menghitung jumlah karakter pada alamat email.

Pertanyaan:
Apa hasil dari fungsi len("info@gmail.com")?
A. 13
B. 12
C. 14
D. 11
E. 10

✅ Jawaban: A
🧠 Pembahasan: String “info@gmail.com” terdiri dari 13 karakter, termasuk tanda “@” dan titik.
📖 Literasi: Memahami fungsi Python secara logis.

Soal 5 (Mudah)

Narasi:
Sebuah program mengecek apakah tanda “@” ada di dalam alamat email.

Pertanyaan:
Operator Python yang digunakan adalah …
A. ==
B. or
C. not
D. in
E. is

✅ Jawaban: D
🧠 Pembahasan: Operator in digunakan untuk memeriksa keberadaan substring dalam string.
📖 Literasi: Literasi digital dasar pada sintaks Python.

🟡 SOAL SEDANG (6–15)

Soal 6 (Sedang)

Narasi:
Seorang siswa menulis kode if "@" not in email: dalam programnya.

Pertanyaan:
Tujuan kode tersebut adalah untuk …
A. Menghapus karakter “@” dari email
B. Memastikan email mengandung karakter “@”
C. Menghitung jumlah tanda “@”
D. Menyimpan karakter sebelum “@”
E. Mengubah format email menjadi huruf besar

✅ Jawaban: B
🧠 Pembahasan: if "@" not in email berarti program akan mendeteksi jika email tidak memiliki tanda “@”.
📖 Literasi: Menafsirkan makna logika kondisi dalam algoritma.

Soal 7 (Sedang)

Narasi:
Guru menjelaskan tentang dekomposisi data, yaitu memecah data kompleks menjadi bagian-bagian kecil.

Pertanyaan:
Manfaat utama dekomposisi data adalah …
A. Menjadikan data tidak terstruktur
B. Menyederhanakan pengolahan data
C. Menghapus data yang tidak diperlukan
D. Menggabungkan semua data menjadi satu
E. Menghindari penggunaan variabel

✅ Jawaban: B
🧠 Pembahasan: Dengan memecah data kompleks, setiap bagian bisa dikelola dengan lebih efisien.
📖 Literasi: Penerapan prinsip berpikir sistematis.

Soal 8 (Sedang)

Narasi:
Sebuah program diminta untuk menampilkan semua karakter setelah tanda “@” dalam alamat email.

Pertanyaan:
Kode Python yang tepat digunakan adalah …
A. email[:posisi_at]
B. email[posisi_at:]
C. email[:-1]
D. email[1:]
E. email.find()

✅ Jawaban: B
🧠 Pembahasan: email[posisi_at:] menampilkan substring mulai dari posisi tanda “@” hingga akhir.
📖 Literasi: Memahami teknik pengambilan substring dalam string.

Soal 9 (Sedang)

Narasi:
Dalam pengolahan data produk, siswa ingin menampilkan produk dengan harga tertinggi.

Pertanyaan:
Elemen yang paling relevan digunakan dalam proses tersebut adalah …
A. Nama Produk
B. Deskripsi Produk
C. Harga
D. Gambar
E. Stok

✅ Jawaban: C
🧠 Pembahasan: Harga digunakan sebagai dasar pengurutan atau perbandingan.
📖 Literasi: Analisis data dalam konteks ekonomi digital.

Soal 10 (Sedang)

Narasi:
Program validasi email tidak menolak userexample.com karena lupa memeriksa karakter “@”.

Pertanyaan:
Kesalahan logika tersebut disebabkan karena …
A. Operator in tidak digunakan
B. Fungsi find() salah posisi
C. Email mengandung titik ganda
D. String terlalu panjang
E. Fungsi len() tidak dipanggil

✅ Jawaban: A
🧠 Pembahasan: Tanpa pemeriksaan in, tanda “@” tidak terdeteksi, menyebabkan email salah dianggap valid.
📖 Literasi: Evaluasi logika program sederhana.

Soal 11 (Sedang)

Narasi:
Dalam biodata siswa, informasi tanggal lahir berguna untuk menghitung usia.

Pertanyaan:
Mengapa tipe data tanggal lahir penting dipisahkan dari tipe data teks?
A. Agar bisa dilakukan operasi hitung waktu
B. Karena tanggal lahir bersifat rahasia
C. Supaya lebih mudah dicetak
D. Karena tidak bisa disimpan sebagai string
E. Untuk memperindah tampilan data

✅ Jawaban: A
🧠 Pembahasan: Data tanggal harus bertipe date agar bisa dihitung (misalnya usia).
📖 Literasi: Pemahaman fungsi tipe data dalam komputasi.

Soal 12 (Sedang)

Narasi:
Dalam validasi email, kode posisi_at == 0 muncul pada program.

Pertanyaan:
Arti dari kondisi tersebut adalah …
A. Tanda “@” ada di awal, sehingga email tidak valid
B. Tanda “@” tidak ditemukan
C. Email terlalu pendek
D. Email valid sepenuhnya
E. Email berisi dua tanda “@”

✅ Jawaban: A
🧠 Pembahasan: Posisi ke-0 berarti “@” ada di awal, yang tidak sesuai format email.
📖 Literasi: Analisis logika kondisi dalam pemrograman.

Soal 13 (Sedang)

Narasi:
Sebuah sistem diminta menolak email yang mengandung spasi.

Pertanyaan:
Mengapa spasi harus dilarang dalam alamat email?
A. Karena tidak dikenali sistem domain
B. Karena memperlambat program
C. Karena membuat email tidak bisa dikirim
D. Karena spasi hanya digunakan di nama pengguna
E. Karena mengubah tipe data

✅ Jawaban: A
🧠 Pembahasan: Format email resmi tidak mengizinkan spasi karena melanggar aturan domain internet.
📖 Literasi: Literasi digital mengenai standar data.

Soal 14 (Sedang)

Narasi:
Dalam pelatihan Python, siswa belajar menggunakan if-else untuk mengevaluasi kondisi email.

Pertanyaan:
Struktur if-else digunakan untuk …
A. Mengulang perintah
B. Menyimpan data
C. Menentukan tindakan berdasarkan kondisi
D. Menghapus variabel
E. Menggabungkan string

✅ Jawaban: C
🧠 Pembahasan: if-else adalah struktur pengambilan keputusan dalam algoritma.
📖 Literasi: Pemahaman dasar kontrol alur dalam pemrograman.

Soal 15 (Sedang)

Narasi:
Dekomposisi data membantu siswa memahami sistem kompleks seperti data produk toko online.

Pertanyaan:
Apa keuntungan terbesar dari dekomposisi data?
A. Program menjadi acak
B. Data lebih efisien diolah
C. Semua elemen bercampur
D. Penyimpanan menjadi lebih sulit
E. Proses menjadi lambat

✅ Jawaban: B
🧠 Pembahasan: Dekomposisi membuat data mudah diakses dan dimanipulasi.
📖 Literasi: Literasi berpikir komputasional.

🔴 SOAL SULIT (16–20)

Soal 16 (Sulit)

Narasi:
Program validasi email dijalankan tanpa memeriksa tanda titik (.) pada domain.

Pertanyaan:
Apa akibat dari kelalaian tersebut?
A. Semua email ditolak
B. Email tanpa domain tetap dianggap valid
C. Program akan error
D. Email menjadi terlalu panjang
E. Output tidak berubah

✅ Jawaban: B
🧠 Pembahasan: Titik dibutuhkan untuk membedakan nama domain, tanpa itu email bisa salah dianggap benar.
📖 Literasi: Analisis logika kesalahan algoritma.

Soal 17 (Sulit)

Narasi:
Dalam data toko online, gambar produk disimpan dalam bentuk teks.

Pertanyaan:
Format data yang paling tepat untuk elemen gambar adalah …
A. Integer
B. URL/Teks
C. Boolean
D. Float
E. Date

✅ Jawaban: B
🧠 Pembahasan: Gambar umumnya disimpan sebagai tautan (URL) atau nama file dalam bentuk teks.
📖 Literasi: Representasi data digital.

Soal 18 (Sulit)

Narasi:
Sebuah tim pengembang ingin membuat sistem pencarian produk dengan cepat tanpa memproses seluruh data.

Pertanyaan:
Langkah paling efisien yang bisa dilakukan adalah …
A. Menghapus data lama
B. Melakukan dekomposisi elemen pencarian
C. Menyimpan semua data di satu variabel
D. Menggunakan tipe data acak
E. Menyimpan dalam file teks besar

✅ Jawaban: B
🧠 Pembahasan: Dekomposisi memungkinkan pencarian dilakukan hanya pada elemen spesifik.
📖 Literasi: Efisiensi algoritmik.

Soal 19 (Sulit)

Narasi:
Seorang siswa membuat fungsi validasi(email) tetapi tidak menambahkan pengecekan domain.

Pertanyaan:
Kelemahan utama fungsi tersebut adalah …
A. Tidak bisa mendeteksi format salah
B. Terlalu lambat dijalankan
C. Menghasilkan output acak
D. Selalu error
E. Tidak memeriksa panjang string

✅ Jawaban: A
🧠 Pembahasan: Domain wajib diperiksa agar format email dinyatakan valid.
📖 Literasi: Evaluasi kualitas kode program.

Soal 20 (Sulit)

Narasi:
Dalam program data kompleks, setiap elemen memiliki tipe data berbeda.

Pertanyaan:
Mengapa penting menyimpan setiap elemen dengan tipe data yang sesuai?
A. Agar data bisa diolah secara tepat sesuai fungsinya
B. Agar semua data bisa dijumlahkan
C. Agar ukuran file kecil
D. Agar data tidak bisa diubah
E. Agar data lebih menarik secara visual

✅ Jawaban: A
🧠 Pembahasan: Pemilihan tipe data yang tepat memastikan operasi logis dan matematis bisa dilakukan dengan benar.
📖 Literasi: Literasi data dan struktur komputasi.

ChatGPT bilang:

Baik 👍 Berdasarkan isi dokumen “LKPD Menerapkan Struktur Data dan Algoritma Standar”, berikut saya susun 20 soal pilihan ganda lengkap dengan:

· Narasi kontekstual (literasi),

· Opsi jawaban A–E,

· Kunci jawaban, dan

· Pembahasan singkat.
Soal dibagi menjadi 5 soal mudah, 10 soal sedang, dan 5 soal sulit sesuai ketentuan Anda.

🟢 TINGKAT MUDAH (1–5)

Soal 1 (Mudah)

Narasi:
Perpustakaan digital menyimpan data seperti judul, penulis, tahun terbit, dan ketersediaan buku.

Pertanyaan:
Data tersebut disebut sebagai data kompleks karena …
A. Hanya berisi satu elemen
B. Terdiri dari banyak elemen yang saling berkaitan
C. Tidak bisa disimpan di komputer
D. Hanya terdiri dari angka
E. Tidak dapat diubah

✅ Jawaban: B
🧠 Pembahasan: Data buku memiliki beberapa elemen seperti judul dan penulis, sehingga bersifat kompleks.
📖 Literasi: Pemahaman konsep data kompleks dalam sistem informasi.

Soal 2 (Mudah)

Narasi:
Sebuah sistem menyimpan data buku dalam daftar (list).

Pertanyaan:
Struktur data list digunakan karena …
A. Data tersusun dalam bentuk acak
B. Dapat menyimpan banyak elemen dalam satu variabel
C. Tidak bisa diakses berdasarkan indeks
D. Tidak efisien untuk data kecil
E. Hanya untuk data numerik

✅ Jawaban: B
🧠 Pembahasan: List berguna untuk menampung banyak data dalam satu variabel dengan indeks yang bisa diakses.
📖 Literasi: Dasar penggunaan struktur data sederhana.

Soal 3 (Mudah)

Narasi:
Dalam program pencarian buku, sistem perlu menemukan buku berdasarkan judul.

Pertanyaan:
Operasi ini disebut …
A. Insertion
B. Searching
C. Sorting
D. Deletion
E. Traversing

✅ Jawaban: B
🧠 Pembahasan: Searching adalah operasi pencarian data tertentu di dalam struktur data.
📖 Literasi: Literasi digital dasar dalam algoritma pencarian.

Soal 4 (Mudah)

Narasi:
Sistem mengurutkan daftar buku berdasarkan tahun terbit.

Pertanyaan:
Operasi yang dilakukan sistem disebut …
A. Sorting
B. Searching
C. Merging
D. Insertion
E. Filtering

✅ Jawaban: A
🧠 Pembahasan: Sorting adalah proses mengurutkan data berdasarkan kriteria tertentu, seperti tahun terbit.
📖 Literasi: Konsep dasar pengurutan dalam algoritma.

Soal 5 (Mudah)

Narasi:
Dalam sistem perpustakaan digital, pengguna sering menambahkan buku baru ke dalam koleksi.

Pertanyaan:
Operasi yang dilakukan adalah …
A. Update
B. Delete
C. Insert
D. Search
E. Sort

✅ Jawaban: C
🧠 Pembahasan: Penambahan data disebut operasi insert.
📖 Literasi: Memahami operasi dasar dalam manipulasi data.

🟡 TINGKAT SEDANG (6–15)

Soal 6 (Sedang)

Narasi:
Sistem perpustakaan mulai lambat karena data semakin banyak.

Pertanyaan:
Faktor utama penyebab lambatnya sistem adalah …
A. Terlalu banyak variabel
B. Struktur data yang tidak efisien
C. Kesalahan pengguna
D. Internet lambat
E. Terlalu banyak warna tampilan

✅ Jawaban: B
🧠 Pembahasan: Struktur data sederhana seperti list tidak efisien untuk data besar.
📖 Literasi: Analisis penyebab masalah kinerja sistem digital.

Soal 7 (Sedang)

Narasi:
Tim pengembang ingin mempercepat pencarian buku berdasarkan judul.

Pertanyaan:
Struktur data apa yang lebih efisien dibandingkan list untuk pencarian cepat?
A. Array
B. Stack
C. Queue
D. Hash Table
E. Tree Traversal

✅ Jawaban: D
🧠 Pembahasan: Hash Table memungkinkan pencarian cepat dengan indeks berbasis kunci.
📖 Literasi: Pemahaman efisiensi pencarian data.

Soal 8 (Sedang)

Narasi:
Setiap buku di perpustakaan diurutkan berdasarkan tahun terbit untuk ditampilkan dari yang terbaru.

Pertanyaan:
Algoritma pengurutan yang efisien untuk data besar adalah …
A. Bubble Sort
B. Selection Sort
C. Merge Sort
D. Insertion Sort
E. Random Sort

✅ Jawaban: C
🧠 Pembahasan: Merge Sort efisien untuk data besar karena menggunakan prinsip divide and conquer.
📖 Literasi: Literasi algoritmik tentang efisiensi waktu.

Soal 9 (Sedang)

Narasi:
Perpustakaan digital ingin menghapus data buku yang sudah tidak tersedia.

Pertanyaan:
Operasi yang dilakukan disebut …
A. Delete
B. Sort
C. Insert
D. Search
E. Update

✅ Jawaban: A
🧠 Pembahasan: Penghapusan data dari sistem disebut delete operation.
📖 Literasi: Keterampilan dasar manajemen data.

Soal 10 (Sedang)

Narasi:
Struktur data tree digunakan untuk menyimpan data buku berdasarkan abjad judul.

Pertanyaan:
Keuntungan menggunakan tree adalah …
A. Menyimpan data secara acak
B. Mempermudah pencarian dan pengurutan
C. Menghapus data otomatis
D. Menyimpan data dalam bentuk array
E. Tidak membutuhkan memori

✅ Jawaban: B
🧠 Pembahasan: Tree memudahkan proses pencarian dan pengurutan dengan hubungan hierarki.
📖 Literasi: Pemahaman hierarki data dalam algoritma.

Soal 11 (Sedang)

Narasi:
Sistem menggunakan algoritma binary search untuk menemukan judul buku.

Pertanyaan:
Syarat agar binary search dapat digunakan adalah …
A. Data harus acak
B. Data harus sudah diurutkan
C. Data harus berupa angka
D. Data harus tidak berulang
E. Data harus disimpan di array

✅ Jawaban: B
🧠 Pembahasan: Binary search hanya dapat bekerja pada data yang sudah diurutkan.
📖 Literasi: Literasi algoritmik berbasis kondisi awal data.

Soal 12 (Sedang)

Narasi:
Sebuah algoritma efisien jika …
A. Cepat dan menggunakan memori sedikit
B. Lama tapi akurat
C. Cepat tapi boros memori
D. Boros energi
E. Menggunakan banyak variabel

✅ Jawaban: A
🧠 Pembahasan: Efisiensi algoritma dinilai dari waktu eksekusi dan penggunaan memori.
📖 Literasi: Evaluasi efisiensi algoritmik.

Soal 13 (Sedang)

Narasi:
Pihak pengembang menguji dua algoritma: Bubble Sort dan Quick Sort.

Pertanyaan:
Algoritma yang lebih efisien untuk data besar adalah …
A. Bubble Sort
B. Selection Sort
C. Quick Sort
D. Merge Sort
E. Linear Sort

✅ Jawaban: C
🧠 Pembahasan: Quick Sort lebih cepat karena pembagian dan penggabungan yang efisien.
📖 Literasi: Analisis perbandingan performa algoritma.

Soal 14 (Sedang)

Narasi:
Pengembang ingin menyimpan data pengguna yang selalu ditambahkan dan dihapus di akhir.

Pertanyaan:
Struktur data yang cocok digunakan adalah …
A. Stack
B. Queue
C. List
D. Tree
E. Hash Table

✅ Jawaban: A
🧠 Pembahasan: Stack bekerja dengan prinsip LIFO (Last In, First Out).
📖 Literasi: Pengenalan konsep tumpukan dalam algoritma.

Soal 15 (Sedang)

Narasi:
Sistem menampilkan antrian pengguna yang sedang meminjam buku.

Pertanyaan:
Struktur data yang sesuai untuk situasi ini adalah …
A. Stack
B. Queue
C. Array
D. Tree
E. Dictionary

✅ Jawaban: B
🧠 Pembahasan: Queue menggunakan prinsip FIFO (First In, First Out).
📖 Literasi: Penerapan algoritma dalam situasi nyata.

🔴 TINGKAT SULIT (16–20)

Soal 16 (Sulit)

Narasi:
Sistem perpustakaan perlu memproses jutaan data buku setiap hari.

Pertanyaan:
Mengapa pemilihan struktur data sangat penting dalam kasus ini?
A. Agar tampilan menarik
B. Agar algoritma bekerja lebih efisien
C. Agar program lebih pendek
D. Agar data tidak bisa diubah
E. Agar semua data disimpan di memori

✅ Jawaban: B
🧠 Pembahasan: Struktur data yang tepat meningkatkan efisiensi algoritma dan kecepatan pemrosesan.
📖 Literasi: Literasi berpikir komputasional tingkat lanjut.

Soal 17 (Sulit)

Narasi:
Dalam implementasi, algoritma yang cepat tapi boros memori tidak digunakan.

Pertanyaan:
Alasan utama penolakannya adalah …
A. Program sulit dijalankan
B. Efisiensi tidak hanya berdasarkan waktu
C. Karena algoritma lambat
D. Karena hasilnya tidak valid
E. Karena tidak ada input

✅ Jawaban: B
🧠 Pembahasan: Efisiensi algoritma mencakup keseimbangan antara waktu dan penggunaan memori.
📖 Literasi: Pemahaman multidimensi tentang efisiensi sistem.

Soal 18 (Sulit)

Narasi:
Program memerlukan waktu lama karena operasi pencarian dilakukan dengan linear search.

Pertanyaan:
Solusi terbaik untuk meningkatkan performa pencarian adalah …
A. Menghapus data
B. Menggunakan algoritma binary search
C. Menyimpan data acak
D. Menambahkan memori
E. Mengurangi elemen data

✅ Jawaban: B
🧠 Pembahasan: Binary search lebih cepat dibanding linear search pada data terurut.
📖 Literasi: Optimalisasi performa algoritmik.

Soal 19 (Sulit)

Narasi:
Dalam struktur hash table, dua kunci yang menghasilkan indeks sama disebut …
A. Collision
B. Insertion
C. Overflow
D. Merge
E. Deadlock

✅ Jawaban: A
🧠 Pembahasan: Collision terjadi ketika dua kunci memiliki nilai hash yang sama.
📖 Literasi: Pemahaman lanjutan struktur data hash.

Soal 20 (Sulit)

Narasi:
Pengembang ingin mengoptimalkan kecepatan dan efisiensi memori secara bersamaan.

Pertanyaan:
Kombinasi strategi yang paling tepat adalah …
A. Struktur data efisien dan algoritma cepat
B. Algoritma lambat dan struktur data sederhana
C. Data acak dan algoritma linear
D. Memori besar tanpa algoritma
E. Program pendek tapi lambat

✅ Jawaban: A
🧠 Pembahasan: Kombinasi struktur data efisien dan algoritma cepat menghasilkan sistem optimal.
📖 Literasi: Integrasi konsep struktur data dan algoritma dalam solusi komputasional.

Selasa, 11 November 2025

soal informatika

Bagian A. Soal Mudah (5 Soal)

Soal 1

Soal 2

Soal 3

Soal 4

Soal 5

🟡 Bagian B. Soal Sedang (10 Soal)

Soal 6

Soal 7

Soal 8

Soal 9

Soal 10

Soal 11

Soal 12

Soal 13

Soal 14

Soal 15

Soal 16

🔴 Bagian C. Soal Sulit (5 Soal)

Soal 17

Soal 18

Soal 19

Soal 20

SOAL MUDAH (1–5)

Soal 1 (Mudah)

Soal 2 (Mudah)

Soal 3 (Mudah)

Soal 4 (Mudah)

Soal 5 (Mudah)

🟡 SOAL SEDANG (6–15)

Soal 6 (Sedang)

Soal 7 (Sedang)

Soal 8 (Sedang)

Soal 9 (Sedang)

Soal 10 (Sedang)

Soal 11 (Sedang)

Soal 12 (Sedang)

Soal 13 (Sedang)

Soal 14 (Sedang)

Soal 15 (Sedang)

🔴 SOAL SULIT (16–20)

Soal 16 (Sulit)

Soal 17 (Sulit)

Soal 18 (Sulit)

Soal 19 (Sulit)

Soal 20 (Sulit)

ChatGPT bilang:

🟢 TINGKAT MUDAH (1–5)

Soal 1 (Mudah)

Soal 2 (Mudah)

Soal 3 (Mudah)

Soal 4 (Mudah)

Soal 5 (Mudah)

🟡 TINGKAT SEDANG (6–15)

Soal 6 (Sedang)

Soal 7 (Sedang)

Soal 8 (Sedang)

Soal 9 (Sedang)

Soal 10 (Sedang)

Soal 11 (Sedang)

Soal 12 (Sedang)

Soal 13 (Sedang)

Soal 14 (Sedang)

Soal 15 (Sedang)

🔴 TINGKAT SULIT (16–20)

Soal 16 (Sulit)

Soal 17 (Sulit)

Soal 18 (Sulit)

Soal 19 (Sulit)

Soal 20 (Sulit)