Levenshtein dan Similar Text untuk Perbaikan Kesalahan Penulisan

Isi Artikel Utama

Dika Rizky Yunianto
Elok Nur Hamdana
Imam Fahrur Rozi

Abstrak

Kesalahan penulisan atau typo sering terjadi, baik dalam bentuk konvensional maupun digital. Tidak menutup kemungkinan pula untuk terjadi saat pengetikan pada platform website. Similaritas teks dapat menjadi salah satu metode untuk mengatasi adanya kesalahan penulisan. Nilai kemiripan antar dua kata dapat dijadikan patokan untuk membenarkan kata yang typo. Pada bahasa pemrograman PHP dimana bahasa yang sering digunakan dalam membangun sebuah website, terdapat fungsi similaritas teks yaitu levenshtein() dan similar_text(). Fungsi levenshtein() menghasilkan nilai perbedaan kedua string, sedangkan fungsi similar_text() menghasilkan nilai kemiripan dari dua string. Kombinasi dari kedua fungsi tersebut dapat melihat dari kedekatan dua string dan juga perbedaan kedua string. Hasil dari uji coba menyatakan bahwa kombinasi kedua fungsi memiliki nilai precision 85%. Dimana nilai tersebut lebih besar dibandingkan dengan nilai precision dari fungsi levensthein() dan juga similar_text() ketika berdiri sendiri-sendiri.

Rincian Artikel

Bagian
Informatika

Referensi

Beall, J., & Kafadar, K. (2004). The effectiveness of copy cataloging at eliminating typographical errors in shared bibliographic records. Library Resources and Technical Services, 48 (2), 92–101.

Bisandu, D. B., Prasad, R., & Liman, M. M. (2019). Data clustering using efficient similarity measures. Journal of Statistics and Management Systems (22) (5).

Hamidah, N., Yusliani, N., & Rodiah, D. (2020). Spelling Checker using Algorithm Damerau Levenshtein Distance and Cosine Similarity. Sriwijaya Journal of Informatics and Applications, vol. 1, no. 1.

Krstinic, D., Braovic, M., Seric, L., & Bozic-Stulic, D. (2020). Multi-label classifier performance evaluation with confusion matrix. Computer Science & Information Technology (CS & IT).

Mawardi, V. C., Augusfian, F., Pragantha, J., & Bressan, S. (2020). Spelling Correction Application with Damerau-Levenshtein Distance to Help Teachers Examine Typographical Errors in Exam Test Scripts. E3S Web of Conferences (p. 188).

PHP. (1997 - 2023). PHP Documentation. From PHP Documentation: https://www.php.net/manual/en/index.php

Prasetya, D. D., Wibawa, A. P., & Hirashima, T. (2018). The performance of text similarity algorithms. International Journal of Advances in Intelligent Informatics, Vol. 4 No. 1.

Rustamovna, A. U. (2021). Understanding the Levenshtein Distance Equation for Beginners. The American Journal of Engineering and Technology.

Shah, K., & Melo, G. (2020). Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation.

Siahaan, A., Aryza, S., Hariyanto, E., Rusiadi, Lubis, A., Ikhwan, A., & Eh Kan, P. (2018). Combination of Levenshtein distance and Rabin-Karp to improve the accuracy of document equivalence level. International Journal of Engineering & Technology, 7, 2.27.