Levenshtein dan Similar Text untuk Perbaikan Kesalahan Penulisan
Isi Artikel Utama
Abstrak
Kesalahan penulisan atau typo sering terjadi, baik dalam bentuk konvensional maupun digital. Tidak menutup kemungkinan pula untuk terjadi saat pengetikan pada platform website. Similaritas teks dapat menjadi salah satu metode untuk mengatasi adanya kesalahan penulisan. Nilai kemiripan antar dua kata dapat dijadikan patokan untuk membenarkan kata yang typo. Pada bahasa pemrograman PHP dimana bahasa yang sering digunakan dalam membangun sebuah website, terdapat fungsi similaritas teks yaitu levenshtein() dan similar_text(). Fungsi levenshtein() menghasilkan nilai perbedaan kedua string, sedangkan fungsi similar_text() menghasilkan nilai kemiripan dari dua string. Kombinasi dari kedua fungsi tersebut dapat melihat dari kedekatan dua string dan juga perbedaan kedua string. Hasil dari uji coba menyatakan bahwa kombinasi kedua fungsi memiliki nilai precision 85%. Dimana nilai tersebut lebih besar dibandingkan dengan nilai precision dari fungsi levensthein() dan juga similar_text() ketika berdiri sendiri-sendiri.
Rincian Artikel

Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Kebijakan yang diajukan untuk jurnal yang menawarkan akses terbuka
Syarat yang harus dipenuhi oleh Penulis sebagai berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Commons Attribution License yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).
Referensi
Beall, J., & Kafadar, K. (2004). The effectiveness of copy cataloging at eliminating typographical errors in shared bibliographic records. Library Resources and Technical Services, 48 (2), 92–101.
Bisandu, D. B., Prasad, R., & Liman, M. M. (2019). Data clustering using efficient similarity measures. Journal of Statistics and Management Systems (22) (5).
Hamidah, N., Yusliani, N., & Rodiah, D. (2020). Spelling Checker using Algorithm Damerau Levenshtein Distance and Cosine Similarity. Sriwijaya Journal of Informatics and Applications, vol. 1, no. 1.
Krstinic, D., Braovic, M., Seric, L., & Bozic-Stulic, D. (2020). Multi-label classifier performance evaluation with confusion matrix. Computer Science & Information Technology (CS & IT).
Mawardi, V. C., Augusfian, F., Pragantha, J., & Bressan, S. (2020). Spelling Correction Application with Damerau-Levenshtein Distance to Help Teachers Examine Typographical Errors in Exam Test Scripts. E3S Web of Conferences (p. 188).
PHP. (1997 - 2023). PHP Documentation. From PHP Documentation: https://www.php.net/manual/en/index.php
Prasetya, D. D., Wibawa, A. P., & Hirashima, T. (2018). The performance of text similarity algorithms. International Journal of Advances in Intelligent Informatics, Vol. 4 No. 1.
Rustamovna, A. U. (2021). Understanding the Levenshtein Distance Equation for Beginners. The American Journal of Engineering and Technology.
Shah, K., & Melo, G. (2020). Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation.
Siahaan, A., Aryza, S., Hariyanto, E., Rusiadi, Lubis, A., Ikhwan, A., & Eh Kan, P. (2018). Combination of Levenshtein distance and Rabin-Karp to improve the accuracy of document equivalence level. International Journal of Engineering & Technology, 7, 2.27.