مدتی پیش نسخهٔ جدیدی از بانک کلمات غلط فارسی را در اختیار توسعهدهندگان لیبرهآفیس گذاشتم.
امروز و همزمان با انتشار لیبرهآفیس ۲۵.۸.۱ کلمات اضافهشده هم در لیبرهآفیس قرار گرفتند.
علاوه بر کلماتِ جدید چندین کلمه را هم که به رسمالخط مرتبط بودند و غلط املایی قلمداد نمیشدند از بانک حذف کردم.
با توجه به اصلاحاتِ صورتگرفته میشود گفت که الان این بانک در وضعیت کموبیش بهینهای قرار گرفته است.
بایگانی دسته: واژهپرداز
نیمفاصلههای کاذب
یکی از چالشهای متون فارسی وجود نیمفاصلههای کاذب است. ظاهری شبیه به نیمفاصله دارند، اما در حقیقت نویسههای دیگری هستند.
این نویسهها خصوصاً وقتی از یک سند به سند دیگری کپی میشوند، میتوانند باعث نمایش نادرست متن، بههمریختگی خطوط و مشکلاتی در جستوجوی محتوا شوند.
در واژهپرداز لیبرهآفیس با کمک عبارتهای باقاعده میشود همهٔ آنها را یافت، اما استفاده از آن زحمتهای خاص خودش را دارد. بنابراین با کمک هوش مصنوعی یک ماکروی پایتون ساختم که همان کار را بیدردسر و بدون خطا انجام بدهد.
این ماکرو همهٔ نیمفاصلههای کاذب (که ۷ تا هستند) را پیدا و اصلاحشان میکند. در پایان کارش هم یک گزارش از نتیجهٔ اصلاحاتش میدهد.
1. Soft Hyphen (SHY) ← کد یونیکد: U+00AD
2. Not Sign ← کد یونیکد: U+00AC
3. Right-to-Left Mark (RLM) ← کد یونیکد: U+200F
4. Four-Per-Em Space ← کد یونیکد: U+2005
5. Zero Width No-Break Space (BOM, ZWNBSP) ← کد یونیکد: U+FEFF
6. Zero Width Space (ZWSP) ← کد یونیکد: U+200B
7. Zero Width Joiner (ZWJ) ← کد یونیکد: U+200D
کند باز شدن فایلهای حجیم مایکروسافتورد
گزارش باگ شماره ۶۴۹۹۱ به یک مشکل قدیمی و ادامهدار در واژهپرداز لیبرهآفیس اشاره دارد: کند باز شدن و عدم پاسخگویی برنامه در زمان کار با فایلهای DOC (فرمت قدیمی مایکروسافتورد) که حجم بالایی دارند و حاوی متن راست به چپ (RTL) هستند.
این مسئله ابتدا در سال ۲۰۱۳ (۱۳۹۲ جلالی) گزارش شد و نشان میداد که باز کردن یک فایل DOC خاص با محتوای فارسی یا عربی، چندین دقیقه زمان میبرد. جالب اینجاست که اگر همان فایل در مایکروسافتورد به فرمت جدیدتر DOCX ذخیره میشد، مشکل حل و فایل بهسرعت باز میشد. این موضوع به احتمال زیاد به نحوهٔ پردازش فایلهای DOC قدیمی توسط لیبرهآفیس برای محتوای RTL مربوط میشود.
با گذشت زمان و انتشار نسخههای جدیدتر لیبرهآفیس، کاربران از سیستمعاملهای مختلف همچنان این مشکل را تأیید کردهاند. تیم توسعهٔ لیبرهآفیس تلاشهایی برای رفع این باگ انجام داده و وصلههایی را نیز برای بهبود وضعیت ارائه کردهاند. با این حال بر اساس آخرین بهروزرسانیها در سال ۲۰۲۳ (۱۴۰۲ جلالی)، هرچند زمان باز شدن فایلها کمی بهبود یافته است، اما واژهپرداز لیبرهآفیس همچنان پس از بارگذاری سند، برای مدتی بدون پاسخ باقی میماند که این موضوع پیمایش و ویرایش متن را برای کاربر بسیار دشوار میکند.
در مجموع این باگ نشان میدهد که پردازش فایلهای DOC حجیم با محتوای راست به چپ همچنان یک چالش برای واژهپرداز لیبرهآفیس است و نیاز به بهینهسازیهای بیشتری دارد تا تجربهٔ کاربری روانتری را برای کاربران زبانهایی مثل فارسی فراهم کند.
بهبود ردگیری تغییرات در لیبرهآفیس
یکی از ویژگیهای واژهپرداز لیبرهآفیس قابلیت ردگیری تغییرات (Track Change) در سند است. این قابلیت با همهٔ مفید بودنش یک مشکل مهم داشت:
قبلاً، تنظیمات ردگیری تغییرات برای کل سند اعمال میشد. یعنی اگر یک نفر ردگیری تغییرات را روشن میکرد، تمام افرادی که روی آن سند کار میکردند، تغییراتشان ثبت میشد. این موضوع میتوانست مشکلساز باشد، بهویژه وقتی چند نفر بهصورت همزمان روی یک سند کار میکردند.
فرض کنید علی مشغول تایپ کردن در یک سند است و رضا ردگیری تغییرات را روشن کند. متأسفانه بلافاصله هر چی علی تایپ کرده است بهصورت تغییراتِ ثبتشده (اضافه شدن) نشان داده میشود، که برای رضا گیجکننده است، چون او فقط در حال تایپ کردن بوده و تنظیمات را تغییر نداده است.
راهحل جدید این است که هر کاربر میتواند بهطور مستقل ردگیری تغییرات را برای خود روشن یا خاموش کند. این یعنی اگر کاربر اول ردگیری تغییرات را خاموش کند، آنچه تایپ کرده است بهعنوان تغییر ثبت نمیشوند، حتی اگر کاربر دوم ردگیری تغییرات را روشن کرده باشد.
مزایای راهحل جدید:
- هر کاربر میتواند تصمیم بگیرد که آیا میخواهد تغییراتش ثبت شود یا خیر؛
- وقتی چند نفر بهصورت همزمان روی یک سند کار میکنند، تداخل کمتری ایجاد میشود؛
- کاربران میتوانند بهراحتی ببینند که چه کسی چه تغییراتی در سند داده است.
بهعبارت سادهتر قبلاً مثل این بود که یک کلید برای روشن و خاموش کردن ردگیری تغییرات وجود داشت که برای همه اعمال میشد. حالا، هر کاربر یک کلید جداگانه برای خودش دارد. این ویژگی جدید، کار با اسناد مشترک را آسانتر و شفافتر میکند، زیرا به هر کاربر اجازه میدهد تا کنترل بیشتری بر ردگیری تغییرات داشته باشد.
حذف فاصلههای اضافه
بهطور کلی در هیچجای اسناد متنی (اسنادی که در واژهپردازها آماده شدهاند) نباید بین دو واژه بیشتر از یک فاصله (اسپیس) وجود داشته باشد و فاصلههای بیشتر گذشته از آنکه نشانهٔ شلختگی حروفچین است، سند را هم از زیبایی و شکیل بودنش درمیآورد.
نکته: برای درج فاصلههای بیشتر در جاهای مختلف (مثلاً شعر) باید از راهکارهای دقیقتر و بیدردسرتری استفاده کرد.
اما حالا اگر متنی به دستمان رسید که در جایجای آن، دو فاصله یا بیشتر پشتسرهم تایپ شده بود، باید چه کرد؟ آیا باید فاصلههای اضافه را یکییکی و دستی حذف کرد؟ اگر سند چندین و چند صفحه بود چی؟
نه، راه بسیار سادهتری هست:
با عبارت باقاعدهٔ زیر میتوانید بهیکباره تمام فاصلههای اضافی را حذف کنید.
با CTRL+H پنجرهٔ Find & Repalce را باز کنید. در قسمت Other Options روی مثلث کوچک کنارش بزنید و سپس هفتک (تیک) Regular Expressions را بزنید تا امکان استفاده از عبارتهای باقاعده فراهم بشود.
حالا در فیلد Find عبارت باقاعدهٔ
[:space:]{2,}
را بنویسید و در فیلد Replace فقط یک بار دکمهٔ اسپیس را بزنید. برای خاتمهٔ کار روی دکمهٔ Replace All بزنید و تمام.
تصحیح کارآمدتر کلمات فارسی
یازده سال قبل با اشتیاق و پیگیریهای زیاد و با حمایتهایی که علاقهمندان نرمافزار آزاد کردند زبان فارسی و بانکی غنی از واژههای فارسی به بخش تصحیح خودکار کلمات در مجموعهنرمافزار اداری اپنآفیس اضافه شد و بعدتر در لیبرهآفیس بهینه و تثبیت شد.
پس از وقفهای طولانی، با کمکهای فنی یک دوست آن بانک حجیم را اصلاح و بهینه کردهام و در اختیار تیم توسعهدهندهٔ لیبرهآفیس گذاشتم.
کلمات پرشمار زیادی که در حوزهٔ رسمالخط بودند و نمیتوان آنها را غلط دانست از بانک حذف شدند تا در جای بهتر و درستتری از لیبرهآفیس بهکار گرفته شوند.
هدف این بود که باری را که بر دوش بخش تصحیح خودکار نهاده شده از دوش آن برداریم و این مسئولیت را به افزونهای مشابه ویراستیار بسپاریم. این تفکیک این فرصت را ایجاد میکند تا بانک را با واژههایی واقعاً لازم غنیتر کنیم و قدرت لیبرهآفیس را در تصحیح خودکار کلمات غلط بیشتر کنیم.
علاوه بر این صورت غلط و درست واژههای بسیار دیگری نیز به بانک افزوده شدند تا کارآمدی آن بیشتر از قبل شود.
بانک جدید در انتشار بعدی لیبرهآفیس، یعنی نسخههای ۲۴.۸.۶ و ۲۵.۲.۲ در دسترس کاربران خواهد بود.
نکته: بهروزرسانی این بانک حتی پس از انتشار نسخهٔ پایدار بعدی متوقف نخواهد شد و با گذشت زمان بهتر و غنیتر خواهد شد.
مدیریت سادهتر نظرات
چنانچه ویرایش یک کتاب را به شما سپرده باشند، اگر بخواهید اصلاحات مد نظرتان را به نویسنده پیشنهاد کنید، منطقیترین ابرازی که در دست دارید ابزار نظرات یا همان Comments است.
این نظرات در حاشیهٔ سند نمایش داده میشوند و اگر تعدادشان زیاد بشوند، مدیریت آنها برای شما که ویراستار آن کتاب هستید و حتی برای نویسنده که قرار است پس از پایان کارتان اصلاحات شما را بررسی کند، دشوار و پردردسر میشود.
حالا یک خبر خوب دارم:
در مسابقهٔ کدنویسی تابستانهٔ گوگل یکی از ایدههایی که پذیرفته شده همین است.
Mohit Marathe تصمیم گرفته است، نظرات اصلاحی ویراستار را از حاشیهٔ سند به نوار کناری لیبرهآفیس بیاورد تا دسترسی به آنها راحتتر و ویرایش و بررسی آن سهلتر بشود.
واقعاً دستش درد نکند که سراغ خوب قابلیتی رفته است.