طبق آمار W۳TeECH، در سال ۲۰۱۹ برای نخستین بار در تاریخ، زبان فارسی یکی از ۵ زبان اول پرکاربرد در وب با رشد ویژهای همراه شد و به سهم ۳.۸ درصدی از وب رسید، اما این وضعیت در نیمه دوم سال ۲۰۲۰ روند کاهشی به خود گرفت که میتوان علت آن را در سرعت نسبی بالاتر تولید محتوای سایر زبانها در بازه زمانی کرونا دانست و موجب شد این عدد به زیر سه درصد نزول کند. خوشبختانه با گذار از یک نزول ناگهانی، طی نیمه اول سال ۲۰۲۱ زبان فارسی دوباره روند صعودی خود را در پیش گرفته و با کسب سهم ۳.۴ درصدی همچنان پنجمین زبان وب است.
طبق آمار منتشر شده در W۳TeCH رشد زبان فارسی نسبت به زبانهایی مانند زبان عربی و انگلیسی بیشتر بوده است. اما در میان زبانهای حوزه غرب آسیا، زبان ترکی از زبان فارسی رشد بیشتری داشته است. به طوری که در سال ۲۰۱۸ زبان فارسی بالاترین رتبه را در حوزه غرب آسیا داشت؛ ولی اکنون زبان ترکی در این حوزه پیشی گرفته و به سومین زبان وبسایتهای دنیا تبدیل شده است.
زبان روسی همچنان رشد خوب چند سال اخیر خود را ادامه داده و عنوان دومین زبان را پس از زبان انگلیسی دارا است. زبان روسی توانسته برتری قابل توجهی نسبت به سایر زبانهای قدرتمند همچون آلمانی و فرانسوی به دست آورد.
البته این افزایش کمیت زبان فارسی به شرطی مقبول است و موجب رشد این زبان میشود که کیفیت محتوا نیز در حال افزایش باشد. طبق آمار ارائه شده در سال ۹۶، در میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر پارسیجو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم بوده است که نشان از ضعف کیفیت محتوا دارد؛ ولی آمار دقیقی از وضعیت جدید کیفیت محتوا در دسترس نیست. اما برخی شاخصها نظیر افزایش چشمگیر محتوای کتاب دیجیتالی فارسی نشان از رشد محتوای ارزشمند در این حوزه دارد. هرچند تناسب رشد کیفیت و کمیت محتوای فارسی نیاز به پژوهشهای گستردهتر دارد.
تاثیرات فضای مجازی بر تغییر شکل خط و ساختار زبان فارسی
دو رسانه «گفتار» و «خط» رسانههایی هستند که عمر زیادی دارند و از مدتها قبل با انسان بودهاند هرچند ممکن است بهزودی رسانههایی مانند رسانه انتقال مفهوم از مغز یک انسان به مغز انسانی دیگر ظهور کنند؛ اما فعلاً همین دو رسانه در اختیار است.
فضای مجازی از این جهت که حوزه نفوذ زبانی را افزایش میدهد، آموزش زبان را آسان و دسترسی به محتوای علمی، فرهنگی و خبر را تسهیل کرده و محتوای فارسی را در سراسر فضای مجازی گسترش داده و کسب و کارهای جدیدی خلق میکند، یک فرصت است؛ اما مشکل از آنجا آغاز میشود که محتوای ناسالم در حوزه خط، زبان و فرهنگ در فضای مجازی منتشر شود. زیرا محتوای اصیل و ارزشمند است که موجب غنای زبان میگردد و کاهش کیفیت آن آسیب جدی به زبان وارد خواهد کرد.
اما در خصوص خط فارسی، فضای مجازی آسیبهایی از جمله شکستهنویسی، غلطنویسی و خلاصهنویسی بیضابطه را در بر داشته است. که به ماهیت و اقتضائات فضای مجازی که افزایش سرعت در نگارش است برمیگردد. برای اصلاح این روند و کاهش آسیبهای آن نیاز است راهکارهای ذیل بهصورت همزمان و با اراده کافی در دستگاههای سیاستگذار و حاکمیتی حوزه خط و زبان فارسی از جمله فرهنگستان زبان و ادب فارسی و مرکز ملی فضای مجازی پیگیری شوند.
تفکیک قالب نوشتاری مجازی و غیر مجازی
در حال حاضر گونه معیار زبان فارسی با گونه فضای مجازی آن تفاوت دارد و چنانچه گونه فضای مجازی خط و زبان فارسی به رسمیت شناخته شود و استانداردسازی گردد و هرکدام از این گونهها در جای خود استفاده شوند، مشکلی ایجاد نخواهد شد. ولی چنانچه زبانور آن قدر در گونه زبانی خاص غرق شود که وقتی وارد گونه جدید شود نتواند خود را تطبیق دهد، موجب ایجاد آسیب به خط و زبان میشود.
ضابطهمند شدن شکستهنویسی در فضای مجازی
با توجه به مقتضیات نگارش در فضای مجازی که از جمله آنها سرعت بالا در این فضا است. چنانچه شکستهنویسیها توسط نهادی نظیر فرهنگستان زبان و ادب فارسی ضابطهمند شوند، میتواند به ساماندهی خط و زبان در این حوزه کمک کند. نمونه این کار در کشورهای توسعهیافته و بر روی زبانهایی نظیر انگلیسی انجام شده است.
توسعه ابزارهای پردازشی برای تسهیل کار کاربران
ابزارهای پردازشی نظیر ابزارهای ویرایش خودکار و یا ابزارهای تصحیح خودکار املایی میتوانند تاثیر بسزایی در جلوگیری از آسیب به خط و زبان در حین نگارش کاربران در فضای مجازی داشته باشد. این ابزارها ضمن کمک به سرعت نگارش کاربر، اشتباهات سهوی کاربران را نیز تصحیح میکنند.
پردازش خط و زبان فارسی
یکی از موضوعات مهم برای رشد و توسعه زبان فارسی و بسیاری از فناوریهای دیگر نظیر کلاندادهها و اینترنت اشیاء در کشور، توسعه پردازش خط و زبان فارسی است. شناخت علایق، تفکر و پیشبینی الگوهای جامعه نیاز به پردازش محتوای تولید شده توسط کاربران در فضای مجازی دارد. یکی از روندهای جدی در حوزه توسعه محتوا در آینده نزدیک، بهرهگیری از ماشینها و رباتها برای تولید محتوا است که این کار مستلزم پردازش ماشینی خط و زبان است. همچنین به تازگی مهندسی افکار و نگرشها از طریق دستکاری ماشینی کامنتها و پستها توسط ماشین انجام میشود.
اندازه بازار محصولات پردازش زبان طبیعی در سال ۲۰۲۰ بالغ بر ۱۰.۷ میلیارد دلار بوده است و پیشبینی میشود تا سال ۲۰۲۶ با نرخ رشد سالانه ۲۶.۸۴ درصدی به ۴۸.۴۶ میلیارد دلار برسد. علیرغم این بازار بزرگ جهانی، رقم این بازار در داخل کشور بسیار ناچیز است. شرکتهای کمی در این زمینه فعال هستند و کیفیت خدمات چندان بالا نیست. در بسیاری از حوزهها، بازار در تصاحب رقبای خارجی نظیر گوگل و مایکروسافت است. چالشهای مطرح در حوزه پردازش خط و زبان فارسی در سه سطح بخش عرضه، بخش تقاضا و فناوری مطرح میشوند.
چالشهای بخش عرضه
چالشهای شناسایی شده در این بخش عبارتاند از:
در حال حاضر محصولات رایگان و با کیفیت خارجی در بازار وجود دارند که مشتریان بیشتر تمایل در استفاده از آنها را دارند.
موضوع مالکیت معنوی و استفاده تجاری دادگان در کشور تعیین تکلیف نشده است و اجازهنامه استفاده و روند استفاده نیز هنوز مشخص نیست.
هزینه تهیه برخی از زیرساختهای این حوزه وابسته به نرخ ارز است و در نتیجه هزینه ریالی تمام شده محصولات به دلیل نوسانات ارز از مشکلات عرضهکنندگان است.
چالشهای بخش تقاضا
در حوزه تقاضا اعتماد به محصولات داخلی کم است و غالب مشتریان ترجیح میدهند از محصولات آماده خارجی استفاده کنند. میتوان گفت علت اولیه مهم در این خصوص، فقدان مرجع مشخصی برای ارزیابی و استانداردسازی محصولات، ابزارها و خدمات این حوزه است.
چالشهای بخش فناوری
در دسترس نبودن دادگان خصوصاً دادگان متنی و گفتاری از نوع محاورهای و همچنین تامین زیرساختهای پردازشی سختافزاری از جمله چالشهای فناوری در این حوزه است.
سایر چالشها در حوزه خط و زبان فارسی
علاوه برنکات یاد شده در حوزه محتوایی و پردازشی خط و زبان فارسی در فضای مجازی، به چالشهای زیر نیز در این حوزه میتوان اشاره کرد که موجب شده است زبان فارسی در فضای مجازی نتواند جایگاه شایسته خود را پیدا کند.
- عدم تمایل محققان و دانشگاهیان به انتشار نتایج تحقیقات خود به زبان فارسی در فضای مجازی
- کمبود نشریات معتبر علمی الکترونیکی به زبان فارسی در حوزههای مختلف علم و فناوری
- عدم ساماندهی مناسب بانکهای اطلاعاتی علمی-پژوهشی فارسی
- کم توجهی به امکانات و قابلیتهای فضای مجازی در جهت ارتقای مهارتهای زبانی و ادبی عموم جامعه
- عدم بهرهبرداری مناسب از فرصتها و قابلیتهای ویژه فضای مجازی به منظور گسترش و آموزش مجازی خط و زبان فارسی به غیرفارسی زبانان و کودکان ایرانی خارج از کشور
- کمتوجهی به استفاده از ظرفیتهای بینالمللی بهویژه کشورهای فارسی زبان برای اجرای طرحهای مشترک در زمینههای صیانت و ترویج خط و زبان فارسی و توسعه منابع زبانی و زیر ساختهای پردازشی
- عدم وجود روالهای رصد تحلیلی و آیندهپژوهی در خصوص وضعیت خط و زبان فارسی در فضای مجازی
راهکارهای پیشنهادی
بهرهمندی از فرصتهای فضای مجازی و جلوگیری از تهدیدهای آن برای خط و زبان فارسی نیاز به عزم ملی دارد؛ لذا زمینهسازی برای ایجاد و تحقق نهضت ملی صیانت و ترویج خط و زبان فارسی در فضای مجازی ضرورت مییابد. (۱) احیای آگاهیهای عمومی و ارتقای خودباوری و غیرت ملی نسبت به جایگاه و ارزش خط و زبان فارسی در تبیین و حفظ معارف والای بشری، (۲) فعالسازی خواص و تأثیرگذاران دینی، فکری، علمی، فرهنگی، هنری و سیاسی در خصوص اشاعه گفتمان صیانت از خط و زبان فارسی به عنوان یک سرمایه بیبدیل ملی و همچنین، (۳) جریانسازی اجتماعی بر بسترهای گوناگون فضای مجازی برای پاسداشت خط و زبان معیار از جمله اقدامات اساسی موردنیاز برای زمینهسازی تحقق نهضت ملی است.
فضای مجازی از نظر فنی و کاربری، قابلیتها و محدودیتهایی دارد که شرایط و مقتضیات خاصی را بر خط و زبان حاکم میکند. به منظور پاسخگویی به هنگام و مؤثر به نیازهای خط و زبان در فضای مجازی و تجهیز خط و زبان، رصد مستمر و تحلیلی و چارهاندیشی علمی و فنی نسبت به مسائل ضرورت دارد.
در همین راستا، نیاز به ابزارها و سامانههای کارآمد پشتیبانیکننده از کاربرد خط و زبان فارسی در فضای مجازی، مسئله مهمی است که تا به حال به نحو مؤثری به آن پرداخته نشده است و عملاً بازار این حوزه در کشور در دست پلتفرمهای بزرگ نظیر گوگل است. از این رو، تحقق مدیریت متمرکز و هدفمند دانش و فناوری در این حوزه، توسعه دادگان و منابع زبانی و سامانههای پردازشی از الزامات اساسی در شرایط حاضر است.
علاوه بر این، برای توسعه خط و زبان فارسی در فضای مجازی لازم است پیوندهای راهبردی و همکاریهای بینالمللی بهویژه با کشورهای فارسی زبان بیش از پیش برقرار گردد و از ظرفیتهای بینالمللی در این راستا استفاده شود.
* کارشناس مرکز ملی فضای مجازی