Belajar Regex dengan Python

Zen 8 Desember 2016

Belajar Regex dengan Python

Sebagai seorang coder, pastinya tidak asing dengan bahasa pemrograman Python, yang diciptakan oleh Guido van Rossum pada tahun 1989 dan terkenal dengan kemudahan coding dikarenakan aturan syntax yang simpel. Nah, kali ini kita akan mencoba salah satu modul Python yang sangat berguna yaitu Regex.

Sebelum memulai coding Python, yang pertama harus disiapkan adalah memastikan bahwa interpreter Python sudah tersedia di komputer. Jika belum, kamu bisa mendownloadnya di situsnya Python (tersedia untuk Windows, Linux, dan Mac). Tapi kalau kamu menggunakan Linux, biasanya interpreternya sudah tersedia. Untuk tutorial ini, kita menggunakan Python versi 2.

Berikut ini beberapa contoh regex menggunakan Python:

Mengekstrak Sumber Gambar HTML

Script

import re teks = """<img src="bintang.jpg"/> <img src="dinosaurus.jpg"/> <img src="tembok.jpg"/> <img src="beruang.jpg"/> <img src="singa.jpg"/>""" print "Teks:" print teks print hasil = re.sub(r"<img src=\"(.{1,})\"/>", r"\1", teks) print "Hasil:" print hasil

Hasil

Teks:
<img src="bintang.jpg"/>
<img src="dinosaurus.jpg"/>
<img src="tembok.jpg"/>
<img src="beruang.jpg"/>
<img src="singa.jpg"/>

Hasil:
bintang.jpg
dinosaurus.jpg
tembok.jpg
beruang.jpg
singa.jpg

Mengganti Nama File Secara Massal

Script

import re teks = """1. roti maryam.jpg 2. es teh manis.jpg 3. jus alpukat.jpg 4. roti buaya.jpg 5. durian.jpg 6. coklat.jpg 7. spageti.jpg 8. rambutan.jpg 9. nasi goreng.jpg 10. martabak.jpg 11. pecel.jpg""" print "Teks:" print teks print hasil = re.sub(r"(^|\n)(\d{1}\.)", r"\1a0aaaaa\2", teks) hasil = re.sub(r"a0aaaaa", "0", hasil) print "Hasil:" print hasil

Hasil

Teks:
1. roti maryam.jpg
2. es teh manis.jpg
3. jus alpukat.jpg
4. roti buaya.jpg
5. durian.jpg
6. coklat.jpg
7. spageti.jpg
8. rambutan.jpg
9. nasi goreng.jpg
10. martabak.jpg
11. pecel.jpg

Hasil:
01. roti maryam.jpg
02. es teh manis.jpg
03. jus alpukat.jpg
04. roti buaya.jpg
05. durian.jpg
06. coklat.jpg
07. spageti.jpg
08. rambutan.jpg
09. nasi goreng.jpg
10. martabak.jpg
11. pecel.jpg

Itulah sekilas tentang regex dan Python. Karena teknologi ada untuk memudahkan kita, mengapa kita tidak mengeksplorasinya? So, jangan bosan ngulik-ngulik kode ya...