L'Université Punjabi, Patiala, a obtenu une mise à niveau de "Akhar" Logiciel doté de fonctionnalités avancées et déjà mis à la disposition de la police du Pendjab. (Source : Wikimedia Commons)
L'Université du Pendjabi, Patiala, est prête à déployer une version améliorée de son logiciel phare « Akhar », qui signifie « mot » en punjabi, avec des fonctionnalités avancées telles que la recherche multilingue, la vérification orthographique en mettant l'accent sur les noms, la vérification grammaticale du punjabi et la translittération des Texte gurmukhi vers Shahmukhi (écriture pendjabi utilisée dans le Pendjab occidental au Pakistan), écritures Devanagri et romaines et inverse.
Le logiciel a été lancé pour la première fois en 2016 en tant que premier traitement de texte pour le pendjabi, l'hindi, le shahmukhi et l'anglais avec des fonctionnalités puissantes pour la saisie, la vérification orthographique et la traduction.
Le logiciel mis à niveau, développé par le Centre de recherche pour le développement technique de la langue pendjabi de l'université, sera déployé pour le public dans deux mois. Il a déjà été mis à la disposition de la police du Pendjab pour l'analyse des données sur la criminalité.
https://images.indianexpress.com/2020/08/1×1.png
Le DGP du Pendjab Dinkar Gupta a déclaré que le logiciel s'avérait très utile dans l'analyse des données sur la criminalité.
« Nous avons obtenu cet outil de l'Université Punjabi Patiala il y a environ six mois. C'est très pratique pour l'analyse des données sur la criminalité », a déclaré Gupta à The Indian Express.
La mise à niveau est le produit d'une analyse de plus de 2,5 crores de mots pendjabi provenant de diverses sources. La nouvelle version sera équipée de la reconnaissance optique de caractères (OCR) pour convertir les images Gurmukhi en texte et en braille.
Top News Right Now
Cliquez ici pour en savoir plus
« L'analyse d'environ 2,5 crores de mots en pendjabi provenant de diverses plateformes en ligne a révélé que plus de 2,5 % des mots en pendjabi étaient mal orthographiés. En fait, une analyse que nous avons effectuée l'année dernière a révélé que dans la version pendjabi de Wikipédia, environ 9 % des mots pendjabi étaient mal orthographiés », a déclaré Gurpreet Singh Lehal, professeur d'informatique, qui dirige également le Centre de recherche pour le développement technique du pendjabi. Indian Express par téléphone.
Lehal a également révélé que la base de données incluait également le site Web officiel du gouvernement du Pendjab qui a également épelé les mots du Pendjab “à tort”.
Lehal a ajouté : “L'analyse du site Web officiel du gouvernement du Pendjab a révélé que la traduction de Google a été utilisée pour texte en langue pendjabi. Il y avait un certain nombre de mots qui étaient à moitié pendjabi et à moitié anglais. Peu d'accent a été mis sur la vérification orthographique. »
Lehal a déclaré que lors du développement de la version mise à niveau du logiciel, diverses versions des noms des étudiants de l'Université du Pendjab, du Conseil scolaire du Pendjab et les noms des accusés dans les dossiers de la police ont été mis dans la base de données. a ajouté : « Comme les détails contenaient également les noms des parents, nous avons pu collecter une énorme base de données. »
« Nous déploierons la version mise à niveau du logiciel dans deux mois pour le public », a déclaré Lehal, ajoutant : « Nous l'avons déjà mis à la disposition de la police du Pendjab. Il aide la police à rechercher les résultats de n'importe quel nom ou ville qui peut avoir été orthographié différemment par l'officier responsable. » Actuellement, selon Lehal, il y a 7 412 utilisateurs d'Akhar 2016. La dernière version comprendra également une fonction de courrier électronique et un thésaurus Punjabi.
- Le site Web d'Indian Express a été classé GREEN pour sa crédibilité et sa fiabilité par Newsguard, un service mondial qui évalue les sources d'information en fonction de leurs normes journalistiques.