نیم‌فاصله‌های کاذب

نیم‌فاصلهٔ کاذب

یکی از چالش‌های متون فارسی وجود نیم‌فاصله‌های کاذب است. ظاهری شبیه به نیم‌فاصله دارند، اما در حقیقت نویسه‌های دیگری هستند.
این نویسه‌ها خصوصاً وقتی از یک سند به سند دیگری کپی می‌شوند، می‌توانند باعث نمایش نادرست متن، به‌هم‌ریختگی خطوط و مشکلاتی در جست‌وجوی محتوا شوند.

در واژه‌پرداز لیبره‌آفیس با کمک عبارت‌های باقاعده می‌شود همهٔ آن‌ها را یافت، اما استفاده از آن زحمت‌های خاص خودش را دارد. بنابراین با کمک هوش مصنوعی یک ماکروی پایتون ساختم که همان کار را بی‌دردسر و بدون خطا انجام بدهد.
این ماکرو همهٔ نیم‌فاصله‌های کاذب (که ۷ تا هستند) را پیدا و اصلاحشان می‌کند. در پایان کارش هم یک گزارش از نتیجهٔ اصلاحاتش می‌دهد.

1. Soft Hyphen (SHY) ← کد یونیکد: U+00AD
2. Not Sign ← کد یونیکد: U+00AC
3. Right-to-Left Mark (RLM) ← کد یونیکد: U+200F
4. Four-Per-Em Space ← کد یونیکد: U+2005
5. Zero Width No-Break Space (BOM, ZWNBSP) ← کد یونیکد: U+FEFF
6. Zero Width Space (ZWSP) ← کد یونیکد: U+200B
7. Zero Width Joiner (ZWJ) ← کد یونیکد: U+200D

📥 ماکرو را می‌توانید از اینجا یا اینجا دریافت کنید.

لیبره آفیس 25.8 منتشر شد

لیبره آفیس 25.8 منتشر شد

بنیاد مستندات (TDF) انتشار لیبره آفیس نسخه 25.8 با ویژگی‌های جدید و تعداد زیادی رفع اشکال را اعلام کرد. لیبره آفیس برای ویندوز (پردازنده های اینتل و آرم)، macOS (پردازنده‌های اپل سیلیکون و اینتل) و لینوکس (اینتل در قالب DEB و RPM) عرضه می‌شود که شما می‌توانید متناسب با رایانه خودتان آن را از آدرس دانلود همیشگی لیبره آفیس دریافت و نصب کنید:

https://www.libreoffice.org/download/

برای دیدن ویژگی‌های جدید لیبره آفیس 25.8 که از شماره‌گذاری جدید مبتنی بر سال و ماه میلادی استفاده می‌کند، به آدرس زیر مراجعه کنید:

https://wiki.documentfoundation.org/ReleaseNotes/25.8

در این نسخه نیز اشکالات مهمی مرتبط با خط و زبان فارسی حل شده است. برای استفاده از خروجی بهبود یافته، پیشنهاد می‌کنم نسخه 25.8 را دانلود و نصب کنید.

سند فارسی و قفل شدن لیبره‌آفیس

ظاهراً و بر اساس این گزارش در نسخهٔ در حال توسعهٔ لیبره‌آفیس اگر سندی فارسی باشد و قالب (فرمت) فایل هم DOC باشد، لیبره‌آفیس در زمان باز کردن سند قفل می‌کند و عملاً نمی‌شود از آن استفاده کرد.

مشکل کوچکی نیست، اما خوشبختانه برطرف شده و در نسخهٔ 25.8 لیبره‌آفیس وجود نخواهد داشت.

دردسرهای تراز

وقتی در برنامه‌ای مثل لیبره‌آفیس متنی به فارسی یا عربی می‌نویسید، چنانکه می‌دانید این زبان‌ها از راست به چپ نوشته می‌شوند. اما گاهی اوقات لازم است که یک قسمت از متن مثلاً یک جملهٔ انگلیسی یا اعداد و فرمول‌های خاص را از چپ به راست بنویسید. این کار را می‌توانید با تغییر جهت نوشته انجام دهید.

در اینجا متأسفانه مشکلی وجود دارد: وقتی قسمتی از یک سند فارسی را تنظیم می‌کنید که به صورت چپ به راست نمایش داده شود و در عین حال می‌خواهید که متن کاملاً مرتب و صاف در دو طرف صفحه قرار بگیرد (یعنی مثل روزنامه‌ها، از هر دو طرف چپ و راست به خطوط فرضی حاشیه بچسبد)، لیبره‌آفیس قاتی می‌کند!

به زبان ساده، نرم‌افزار نمی‌تواند درست حساب و کتاب کند که هر کلمه و حرف چقدر فضا نیاز دارد تا هم از چپ به راست نمایش داده شود و هم دو طرفش صاف باشد. نتیجه‌اش این می‌شود که قسمتی از متن از حاشیهٔ صفحه بیرون می‌زند و دیگر دیده نمی‌شود یا اینکه ظاهر سندتان را خراب می‌کند.

این مشکل در اینجا گزارش شده است و امیدواریم تا پیش از انتشار نسخهٔ پایدار بعدی برطرف بشود.

دانمارک و لیبره‌آفیس

دولت دانمارک تصمیم گرفته است که به‌تدریج محصولات مایکروسافت را کنار بگذارد و به‌جای آن‌ها از نرم‌افزارهای متن‌باز استفاده کند. دلیل اصلی این اقدام افزایش حاکمیت دیجیتال کشور است.

بر اساس این تصمیم نزدیک به نیمی از کارمندان وزارت امور دیجیتال دانمارک، سیستم‌عامل خود را از ویندوز به لینوکس و مجموعه‌نرم‌افزاری اداری خود را از آفیس ۳۶۵ به لیبره‌آفیس تغییر خواهند داد.

این حرکت بخشی از استراتژی دیجیتالی شدن دولت دانمارک است و هدف آن کنترل بیشتر بر زیرساخت‌ها و داده‌های دیجیتال است. با وجود اینکه ممکن است مشکلاتی در این مسیر پیش بیاید و به‌طور موقت نیاز به بازگشت به محصولات مایکروسافت باشد، اما دولت قاطعانه قصد دارد وابستگی خود را به شرکت‌های بزرگ فناوری کاهش دهد.

حل شدن مشکل هم‌پوشانی حروف فارسی

لیبره‌آفیس ۲۵.۲.۴ امروز منتشر شد. آنچه در این نسخه برای ما به‌عنوان یک کاربر فارسی‌زبان اهمیت دارد حل شدن مشکل (باگ) هم‌پوشانی حروف فارسی در جعبه‌های متنی است.

مشکل این بود که حروف فارسی وقتی در یک جعبهٔ متنی (Text Box) به صورت تراز شده (Justified) قرار می‌گیرند، به‌شکل نادرستی به هم می‌چسبند و هم‌پوشانی (Overlap) بیش از حدی پیدا می‌کنند. این هم‌پوشانی باعث می‌شود که متن به‌هم‌ریخته و دارای اشکالات بصری زیادی به نظر برسد.

گلیف کشیده

هم‌پوشانی حروف

یکی از توسعه‌دهندگان (Jonathan Clark) با بررسی مشکل به این نتیجه رسیده است که این هم‌پوشانی به‌دلیل قرارگیری نادرست گلیف‌های کشیده (Kashida Glyphs) اتفاق می‌افتد.
کشیده نوعی اتصال افقی در حروف فارسی و عربی است که برای تراز کردن خطوط استفاده می‌شود و کارکرد آن پر کردن فضای خالی بین کلمات یا حروف در یک سطر، بدون اضافه کردن فضای سفید (White-space) زیاد است. به‌بیانی دیگر به جای اینکه فاصلهٔ بین کلمات زیاد شود، حروف به‌طور خودکار کشیده می‌شوند.

فونت‌های اضافی!

وقتی در برنامهٔ لیبره‌آفیس می‌خواهیم قلم (فونت) متن را عوض کنیم، یک فهرست بلندبالا از فونت‌ها باز می‌شود. گاهی این فهرست آن‌قدر شلوغ است که پیدا کردن فونت دلخواه سخت می‌شود.

برای همین یکی از کاربران در سال ۲۰۱۵ میلادی (۱۳۹۳ شمسی) در اینجا پیشنهادی داد:
«امکانی بگذارید که بشود بعضی فونت‌ها را از این فهرست پنهان کرد، بدون اینکه لازم باشد آن‌ها را از روی سیستم پاک کنیم.»

اگر این امکان اضافه شود:

  • فهرست فونت‌ها کوتاه‌تر و مرتب‌تر می‌شود.
  • کاربر سریع‌تر فونت دلخواهش را پیدا می‌کند.
  • کسانی که فقط با چند فونت خاص کار دارند، راحت‌تر می‌شوند.

همان کاربر پیشنهاد داده که:

  • جایی در تنظیمات برنامه گذاشته شود (مثلاً در مسیر: ابزارها ← تنظیمات ← فونت‌ها) که بتوان مشخص کرد کدام فونت‌ها نمایش داده شوند و کدام‌ها نه.
  • به‌جای نشان دادن تک‌تک فونت‌ها، فقط نام خانواده‌های فونت (مثلاً Nazanin) را نشان بدهد، نه همهٔ حالت‌های نازک و ضخیم آن جداجدا.

آیا این امکان اضافه شده است؟
نه. تا امروز این قابلیت هنوز در لیبره‌آفیس وجود ندارد، ولی در فهرست پیشنهادها ثبت شده و ممکن است در آینده اضافه شود.