Unmuhbarru.ac.id, Barru – Harmonisasi data bibliometrik merupakan proses untuk menyeragamkan dan mengintegrasikan data bibliometrik dari berbagai sumber yang berbeda. Tidak aja itu, juga untuk menyempurnakan dan meningkatkan validitas data, termasuk akurasi data. Langkah ini, perlu dilakukan agar data bibliometrik dapat digunakan secara efektif untuk analisis dan penelitian.
OpenRefine merupakan insstumen open-source yang dapat digunakan untuk harmonisasi data bibliometrik. OpenRefine menyediakan berbagai fitur yang dapat membantu dalam proses harmonisasi data, seperti:
• Pembersihan data: OpenRefine dapat digunakan untuk membersihkan data bibliometrik dari kesalahan dan inkonsistensi, seperti duplikasi data, format data yang tidak konsisten, dan kesalahan pengetikan.
• Transformasi data: OpenRefine dapat digunakan untuk mentransformasi data bibliometrik ke dalam format yang standar, seperti format MARC atau BIBX.
• Pencocokan data: OpenRefine dapat digunakan untuk mencocokkan data bibliometrik dari berbagai sumber yang berbeda.
• Penggabungan data: OpenRefine dapat digunakan untuk menggabungkan data bibliometrik dari berbagai sumber yang berbeda.
Berikut adalah beberapa contoh bagaimana OpenRefine dapat digunakan untuk harmonisasi data bibliometrik:
• Menyeragamkan format nama penulis: OpenRefine dapat digunakan untuk menstandariskan format nama penulis dari berbagai sumber yang berbeda. Contohnya, OpenRefine dapat digunakan untuk mengubah format nama penulis dari “John Doe” menjadi “Doe, John”.
• Menggabungkan data publikasi dari berbagai sumber: OpenRefine dapat digunakan untuk menggabungkan data publikasi dari berbagai sumber, seperti PubMed, Scopus, dan Google Scholar.
• Mencocokkan data publikasi dengan data peneliti: OpenRefine dapat digunakan untuk mencocokkan data publikasi dengan data peneliti dari berbagai sumber, seperti ORCID dan LinkedIn.
OpenRefine adalah alat yang dapat digunakan untuk harmonisasi data bibliometrik. OpenRefine mudah digunakan dan dapat dipelajari dengan cepat, bahkan oleh pengguna yang tidak memiliki pengalaman dengan pemrograman.
• OpenRefine hanya dapat digunakan untuk harmonisasi data bibliometrik yang tersedia dalam format teks.
• OpenRefine tidak dapat digunakan untuk harmonisasi data bibliometrik yang bersifat proprietary.
Harmonisasi data bibliometrik merupakan proses yang penting untuk dilakukan agar data bibliometrik dapat digunakan secara efektif untuk analisis dan penelitian. OpenRefine adalah alat open-source yang dapat digunakan untuk harmonisasi data bibliometrik. OpenRefine mudah digunakan dan dapat dipelajari dengan cepat, bahkan oleh pengguna yang tidak memiliki pengalaman dengan pemrograman.
Bibliografi
Ahmi, A. (2023, September). OpenRefine: An approachable tool for cleaning and harmonizing bibliographical data. In AIP Conference Proceedings (Vol. 2827, No. 1). AIP Publishing.
Kusumasari, T. F. (2016, October). Data profiling for data quality improvement with OpenRefine. In 2016 international conference on information technology systems and innovation (ICITSI) (1-6). IEEE.
Larsson, P. (2013). Evaluation of open source data cleaning tools: Open refine and data wrangler. University of Washington.
Li, L., Ludäscher, B., & Zhang, Q. (2019). Towards more transparent, reproducible, and reusable data cleaning with OpenRefine. iConference 2019 Proceedings.
Mandal, S. (2022). Integration of Linked Open Data Authorities with OpenRefine: A Methodology for Libraries. Library Philosophy & Practice.
Miller, M., & Vielfaure, N. (2022). OpenRefine: An Approachable Open Tool to Clean Research Data. Bulletin-Association of Canadian Map Libraries and Archives (ACMLA), (170).
Petrova-Antonova, D., & Tancheva, R. (2020). Data cleaning: A case study with openrefine and trifacta wrangler. In Quality of Information and Communications Technology: 13th International Conference, QUATIC 2020, Faro, Portugal, September 9–11, 2020, Proceedings 13 (32-40). Springer International Publishing.
Verborgh, R., & De Wilde, M. (2013). Using openrefine. Packt Publishing Ltd.
Hill, K. M. (2016). In search of useful collection metadata: Using Openrefine to create accurate, complete, and clean title-level collection information. Serials Review, 42(3), 222-228.