حوزه علمیهویژه

سه‌زبانه شدن مقالات نورمگز در مسیر جهانی‌شدن تولید علم در ایران است

مدیرگروه علمی کتابخانه های دیجیتال مرکز نور

مدیرگروه علمی کتابخانه های دیجیتال مرکز نور گفت: با سه‌زبانه شدن مقالات پایگاه نورمگز گامی تازه در جهت افزایش دسترسی و دیده‌شدن تولیدات علمی ایران در سطح بین‌المللی برداشته می شود.

به گزارش ندای قم، حجت‌الاسلام والمسلمین سید مصطفی طباطبایی، مدیر گروه علمی کتابخانه‌های دیجیتال مرکز نور امروز سه شنبه 26خردادماه و در گفت وگو با خبرنگاران با اعلام این خبر اظهارکرد: در ابتدای جا دارد یاد امام شهیدمان و بنیانگذار و مؤسس مرکز تحقیقات کامپیوتری علوم اسلامی (مرکز نور) را گرامی بداریم و نکاتی را پیرامون این گروه علمی از مرکز نور خدمتتان ارائه کنم.

وی با اشاره به مأموریت‌های گروه کتابخانه‌های دیجیتال نور گفت: گروه کتابخانه‌های دیجیتال نور در واقع مسئولیت تحقیقات، پشتیبانی و توسعه علمی مجموعه‌ای از محصولات مرکز نور را بر عهده دارد که این نرم‌افزارها به‌صورت عمومی در اختیار کاربران قرار گرفته‌اند.

این محقق و پژوهشگر علوم اسلامی – انسانی دیجیتال افزود: در کنار این فعالیت‌ها، گروه‌های علمی تخصصی نیز در رشته‌های مختلف از جمله فقه، تاریخ، کلام و سایر حوزه‌های علوم اسلامی و انسانی فعالیت می‌کنند و هر یک به‌صورت تخصصی در حوزه علمی خود ورود دارند.

مدیر گروه علمی کتابخانه‌های دیجیتال مرکز نور ادامه داد: ما در این مجموعه محدودیت موضوعی نداریم و هر نوع محتوایی که به علوم اسلامی و انسانی مربوط باشد در حوزه فعالیت گروه قرار می‌گیرد. از نظر نوع محتوا نیز دامنه فعالیت بسیار گسترده است و تقریباً در همه انواع محتوا ورود کرده‌ایم.

تحولات نورمگز و استفاده از هوش مصنوعی

حجت الاسلام طباطبایی با اشاره به سابقه پایگاه نورمگز گفت: نورمگز یکی از نخستین و قدیمی‌ترین محصولات مرکز نور است که از ابتدا با هدف ارائه متن مجلات علمی راه‌اندازی شد.

وی افزود: در زمان راه‌اندازی، نورمگز نخستین سایتی در ایران بود که به‌صورت جدی و تخصصی به انتشار متن مجلات علمی پرداخت. البته سایت‌هایی بودند که در کنار فعالیت‌های دیگر خود بخشی از مقالات یا مجلات را منتشر می‌کردند، اما سایتی که به‌طور تخصصی به این حوزه بپردازد، نورمگز بود.

وی ادامه داد: از مقطعی به بعد استفاده از فناوری‌های «متن‌کاوی» در نورمگز آغاز شد؛ فناوری‌هایی که امروز در قالب مفهومی به نام «هوش مصنوعی» شناخته می‌شوند و برای بهینه‌سازی داده‌ها و ارائه خدمات هوشمند به کاربران مورد استفاده قرار می‌گیرند.

حجت الاسلام طباطبایی گفت: از جمله اقدامات اولیه در این زمینه، تولید «کلیدواژه‌های ماشینی» بود. ما موتوری طراحی کرده بودیم که هر مقاله را بررسی می‌کرد و بر اساس تحلیل متن، کلیدواژه‌های مناسب برای آن استخراج می‌کرد؛ زیرا کلیدواژه‌هایی که نویسندگان انتخاب می‌کنند گاهی بسیار متنوع یا حتی نادرست است.

وی افزود: یکی دیگر از قابلیت‌ها، شناسایی و پیشنهاد مقالات مرتبط با هر مقاله بود. این سامانه مقالات مشابه را شناسایی کرده و به کاربر پیشنهاد می‌داد.

محقق و پژوهشگر حوزه علمیه قم ادامه داد: همچنین سامانه پیشنهاد مقاله بر اساس رفتار کاربر نیز از گذشته در نورمگز فعال بوده است؛ به این صورت که با توجه به سوابق جست‌وجو و مطالعه کاربران، فهرستی از مقالات جدید یا قدیمی به آن‌ها پیشنهاد می‌شود.

حجت الاسلام طباطبایی گفت: در ادامه این مسیر و با گسترش فناوری‌های هوش مصنوعی، خدمات جدیدی نیز در نورمگز در حال توسعه است که از جمله آن‌ها «چت‌بات مقالات» است و به‌زودی عرضه خواهد شد. این قابلیت شباهت زیادی به چت‌باتی دارد که در نورلایب ارائه شده است.

 پروژه «ترجمه هوشمند علوم انسانی»

مدیر گروه علمی کتابخانه‌های دیجیتال مرکز نور در ادامه به یکی از مهم‌ترین پروژه‌های این مجموعه اشاره کرد و گفت: یکی از پروژه‌هایی که در حال اجرا داریم، استفاده از هوش مصنوعی برای ترجمه مقالات به زبان‌های دیگر است.

وی افزود: هدف این است که در آینده نزدیک تمام مقالات نورمگز به‌صورت سه‌زبانه ارائه شوند؛ به این معنا که اگر مقاله‌ای به زبان فارسی نوشته شده باشد، ترجمه عربی و انگلیسی آن نیز ارائه شود و اگر مقاله‌ای به زبان عربی باشد، نسخه فارسی و انگلیسی آن نیز در دسترس قرار گیرد.

حجت الاسلام طباطبایی با اشاره به اهمیت این موضوع گفت: یکی از مشکلات فعلی این است که تعداد زیادی مقاله عربی در نورمگز وجود دارد که بازدید کمی دارند؛ زیرا بسیاری از پژوهشگران جست‌وجوی خود را با واژه‌های فارسی انجام می‌دهند و تسلط کافی به زبان عربی ندارند.

وی افزود: زمانی که این مقالات ترجمه شوند، کاربران در همان جست‌وجوی اولیه متوجه وجود آن‌ها می‌شوند و می‌توانند از محتوای آن‌ها استفاده کنند.

این فعال عرصه فناوری های دیجیتال ادامه داد: ممکن است برخی بگویند که اگر کسی به مقاله‌ای نیاز داشته باشد می‌تواند آن را خودش با استفاده از هوش مصنوعی ترجمه کند؛ اما مسئله اصلی این است که کاربر ابتدا باید از وجود آن مقاله مطلع شود. وقتی ترجمه به‌صورت آفلاین انجام شده و در موتورهای جست‌وجو ایندکس شود، مقاله در نتایج جست‌وجو ظاهر می‌شود و قابل استفاده خواهد بود.

دیده‌شدن تولیدات علمی ایران در جهان

حجت الاسلام طباطبایی با اشاره به وضعیت تولید علم در ایران گفت: ایران در آمار تولید مقاله رتبه بالایی در جهان دارد، اما بسیاری از این مقالات در سطح جهانی خوانده نمی‌شوند؛ زیرا به زبان فارسی نوشته شده‌اند.

وی افزود: وقتی این مقالات به زبان انگلیسی ترجمه شوند، دانشگاه‌ها و پژوهشگران سراسر جهان از طریق موتورهای جست‌وجو از وجود آن‌ها مطلع می‌شوند و در نتیجه امکان استفاده و ارجاع به آن‌ها فراهم می‌شود.

محقق و پژوهشگر حوزه علمیه قم ادامه داد: این روند باعث افزایش ارجاعات به مقالات ایرانی می‌شود و در نتیجه امتیاز مجلات و نویسندگان ایرانی در سطح جهانی افزایش پیدا می‌کند.

تعامل علمی با جهان اسلام

مدیر گروه کتابخانه‌های دیجیتال مرکز نور با اشاره به تعامل علمی با کشورهای اسلامی گفت: در کنار ترجمه مقالات فارسی، مجلات عربی جهان اسلام نیز ترجمه می‌شود تا پژوهشگران داخلی بتوانند از تولیدات علمی این کشورها مطلع شوند.

حجت الاسلام  طباطبایی افزود: در کشورهای مختلف مانند عراق، لبنان، سوریه، بحرین، امارات و مصر پژوهشگران عرب‌زبان بسیاری فعالیت می‌کنند و دسترسی آن‌ها به مقالات ایرانی می‌تواند موجب تبادل علمی و افزایش تعاملات علمی شود.

وی ادامه داد: در بسیاری از رشته‌های دانشگاهی، دانشجویان موظف‌اند موضوعات مختلف را در کشورهای مختلف بررسی کنند. زمانی که مقالات علمی ایران به زبان‌های دیگر در دسترس باشد، پژوهشگران سایر کشورها نیز می‌توانند از تجربیات علمی ایران استفاده کنند.

وضعیت اجرای پروژه ترجمه

حجت الاسلام طباطبایی درباره روند اجرای این پروژه گفت: زیرساخت فنی پروژه ترجمه آماده شده و مقالات به‌صورت تدریجی به سامانه ترجمه داده می‌شوند و پس از ترجمه روی سایت قرار می‌گیرند.

وی افزود: تاکنون حدود ۲۰ درصد از محتوای هدف ترجمه شده است و این روند همچنان ادامه دارد.

وی ادامه داد: در حال حاضر تمام مجلات دانشگاه تهران در نورمگز به‌صورت سه‌زبانه در دسترس قرار گرفته‌اند و ترجمه سایر مجلات نیز به‌صورت مستمر در حال انجام است.

وی گفت: پیش‌بینی ما این است که تا پایان سال کل پایگاه نورمگز به‌صورت سه‌زبانه در دسترس باشد.

حجت الاسلام طباطبایی همچنین به محدودیت‌های فنی اشاره کرد و افزود: ابزارهای هوش مصنوعی نیازمند سخت‌افزارهای بسیار قدرتمند و پرهزینه هستند و محدودیت‌های سخت‌افزاری سرعت اجرای پروژه را کاهش می‌دهد.

وی گفت: موتور ترجمه مورد استفاده یک موتور بین‌المللی است که برای زبان فارسی بهینه‌سازی و بومی‌سازی شده و بسیاری از مشکلات آن برطرف شده است.

 OCR پیشرفته و متنی‌سازی محتوا

حجت الاسلام طباطبایی در ادامه به توسعه یک موتور OCR پیشرفته اشاره کرد و گفت: با استفاده از این فناوری، مقالاتی که قبلاً فقط به‌صورت تصویر بودند یا کتاب‌هایی که تایپ نشده‌اند، به متن قابل جست‌وجو تبدیل می‌شوند.

وی افزود: این متون در اختیار کاربران قرار می‌گیرد و همچنین در سامانه‌های ترجمه و چت‌بات نیز مورد استفاده قرار خواهد گرفت.

مدیر پایگاه مجلات تخصصی نور (نورمگز) ادامه داد: هدف ما این است که تا پایان سال تمام محتوای نورمگز به متن قابل پردازش تبدیل شود. پس از تکمیل ترجمه مقالات، پروژه ترجمه چندزبانه کتاب‌ها آغاز خواهد شد و سپس پایان‌نامه‌ها نیز وارد این فرایند می‌شوند. در نتیجه مجموعه‌ای عظیم از داده‌های سه‌زبانه در اختیار خواهیم داشت که می‌تواند در چت‌بات‌ها، موتورهای هوش مصنوعی و سامانه‌های آموزشی مورد استفاده قرار گیرد.

وی ادامه داد: در حال حاضر سالانه حدود ۲۵ هزار جلد کتاب به نورلایب افزوده می‌شود و در نورمگز نیز سالانه حدود ۱۲ هزار شماره مجله جدید وارد سامانه می‌شود.

چشم‌انداز «ترجمه هوشمند علوم انسانی»

حجت الاسلام طباطبایی درباره نام این طرح گفت: این پروژه با عنوان «ترجمه هوشمند علوم انسانی» شناخته می‌شود که در فاز نخست مقالات سه‌زبانه می‌شوند، در مرحله بعد کتاب‌ها و در مرحله بعد پایان‌نامه‌ها وارد این فرایند خواهند شد.

وی ادامه داد: این پروژه تنها آغاز یک مسیر بزرگ است و پیامدهای آن در آینده بیشتر مشخص خواهد شد؛ زیرا این داده‌های سه‌زبانه امکان تحلیل‌های جدید و استفاده‌های گسترده در حوزه هوش مصنوعی را فراهم می‌کند.

جایگاه کنونی نورمگز

وی با اشاره به جایگاه فعلی نورمگز گفت: نورمگز امروز به پایگاهی تبدیل شده که حضور در آن برای بسیاری از مجلات علمی معتبر ضروری است. بسیاری از مجلات بلافاصله پس از انتشار هر شماره با ما تماس می‌گیرند و درخواست می‌کنند که شماره جدیدشان سریع‌تر در نورمگز منتشر شود؛ زیرا دیده‌شدن سریع‌تر مقالات برای آن‌ها اهمیت زیادی دارد.

حجت الاسلام طباطبایی ادامه داد: در فضای مجلات علمی، هدف اصلی افزایش دیده‌شدن و افزایش ارجاعات علمی است و به همین دلیل مجلات تمایل دارند در نورمگز حضور داشته باشند.

وی گفت: با اضافه شدن قابلیت «چت‌بات مقالات» و «ترجمه هوشمند»، جایگاه نورمگز در داخل کشور نیز بیش از پیش تقویت خواهد شد.

همکاری‌های بین‌المللی

حجت الاسلام طباطبایی در پایان با اشاره به همکاری‌های خارجی نورمگز گفت: در حال حاضر نورمگز با بسیاری از دانشگاه‌های معتبر در قاره‌های آمریکا، اروپا و آسیای شرقی قرارداد همکاری دارد و این مراکز علمی از خدمات این پایگاه استفاده می‌کنند.

لینک کوتاه این صفحه: https://nedayeghom.ir/13bp

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا