Writings Photos Code Contact Resume Me
تدقيق املائى من كلمات المصحف الشريف
Submitted by msameer on Sat, 04/03/2006 - 3:10am

اوكى

بصراحه نفسى اقول كلام كتير لانى فى حالة من الضيق لا يتخيلها احد
المهم

ده ملف قاموس للمدقق الاملائى aspell انا عملته من نص القران الكريم

فك ضغط الملف فى "/usr/lib/aspell" او دور بنفسك aspell بيدور على القواميس فى انهى داهيه و لو ما عرفتش ولع فى نفسك و بطل تستخدم لينوكس يا حمار

كان هدفى ان اعمل قاموس عربى ل aspell علشان نتنيل نعرف نعمل تدقيق املائى للعربى "و الله نفسى اشتم بجد" لان ى اكتشفت ان بغداد مش هاينفع و هابقى اكتب بوست ليه مش هاينفع

اللى طلعها فى دماغى انى اقوم و اعملها رغم انى كنت ناوى ماعملهاش "لانى محبط من ال community العربى" اسلام.

المهم جبت كلمات المصحف كلها و عملت منها قاموس بس خد بالك لو هاتستعمله ان فيه كلمات كتير غلط هايعديها و يقول عليها صح علشان الرسم العثمانى بتاع المصحف

عمرو غربية وعدنى انى هايبعتلى ملفات صح و هاعمل منها قاموس ينفع للعربى المعاصر

و علشان كده انا مش هادى للناس ال ملفات الاصليه اللى عملت منها القاموس و اللى مش عاجبه يخبط دماغه فى الحيط

و مش عايز اى حد يسالنى على الداتا لانى مش هاديها لحد. اسف

يا رب نفسى اتخانق مع حد

Syndicate content  digg  bookmark

Submitted by خالد حسمى (not verified) on Tue, 14/03/2006 - 2:06pm.

أنا عملت word list من ملفات الداتا بتاعت بغداد (سكريبت عبيط طلع كل الكلمات العربى ورتبها أبجدى) بس كل المحاولات لعمل قاموس aspell منها منفعيتش وعمال يطلعلى أخطاء عن unsupported أو invalid charachter حتى لما خليته يتجاهل الأخطاء طلعلى قاموس ممنوش فايده ولما عملتله dump طلعلى كلمات مش عارفلها encoding

ممكن تقوللى ال ar.dat بتاعك عامل ازاى أو ازاى عملت القاموس بتاعك

وبعدين مستخدمتش الداتا بتاعت بغداد ليه ؟

Submitted by msameer on Tue, 14/03/2006 - 8:12pm.

علشان فيها غلطات و كلمات قديمة و ماحدش عارف اد ايه

ممكن تبعتلى السكربت ؟

Submitted by خالد حسنى (not verified) on Thu, 16/03/2006 - 12:25pm.

عشان مبقاش كداب السكريبت أنا خدته من هنا http://cltb.net/ar/bash.html#10 (تانى واحد )

وتعديل بسيط عليه بقى حاجة زى كده

#!/bin/sh
    rm /tmp/glassory.txt.tmp 2>/dev/null
for i in "$@"
do
echo -n "processing [$i] ...    "
    cat $i | sed -e "s/[0-9A-Za-z\\\/\-\(\)\"\'\`\~\,]/+/g" |
    tr A-Z a-z | tr -s "+" "\012" |
    sed -e "s/^[0-9\\\/ ]*//g" >> /tmp/wordlist.tmp
echo " OK "
done
echo -n "sorting ... "
    cat /tmp/wordlist.tmp | sort | uniq > ./wordlist
    rm /tmp/wordlist.tmp
echo "done!"

وبالمناسبة القاموس اللى عملته منها نفع دلوقتى وشغال بس مجربتوش كويس

Submitted by msameer on Sat, 18/03/2006 - 2:45pm.

اعتقد السكربت ده مش هاينفع لان قاعدة بيانات بغداد مش سهله كده

لو عايز شرح اكتر اقولك تقرا فين

Submitted by خالد حسنى (not verified) on Tue, 21/03/2006 - 2:20pm.

أنا معرفش وجهة نظرك ايه بس انا عملت قاموس شغال نص نص (نص الكلمات بيطلعها غلط يعنى مالوش لازمة)

وياريت تقولى اقرى فين (انا قريت ال info بتاعت aspell بس مأسعفتنيش أوى)

وبعدين أنا شاكك أن aspell هيشتغل كويس مع العربى , انت فلهم الفرق بين العربى والإنجليزى بس نحاول

وعلى فكرة القاموس بتاعك بيكراش aspell لما بشغله مع ملف عربى-انجليزى (حتى كتوب عمل كراش منها)

Submitted by msameer on Tue, 21/03/2006 - 2:56pm.

طب انا هاوصفلك الداتا بتاعة بغداد و دؤلى بس بالعنجليزى معلش بقه ;-)

The database is composed of 6 tables:
1) prefixes
2) suffixes
3) stems

plus three other compatibility tables
4) valid prefixes-stems
5) valid stems-suffixes
6) valid prefixes-stems

so in order for a word to be valid it must be broken to a stem + a prefix + a suffix and all three of them must be in the corresponding tables and they must be compatible paer the tables 4,5,6

الناس بتوع aspell بيقولوا انه هايشتغل و انا جربت بنفسى و اشتغل

بالنسبه للكراش فكتوب اللى معاك مش هايخلى aspell يدقق العربى

استعمل ال CVS احسن

cvs -z3 -d:pserver:anonymous@home.foolab.org:/var/lib/cvs co projects/katoob

ممكن تبعتلى الملف اللى عمل كراش ؟ لو عرفت اخليه يعمل كراش اقدر اصلح ال bug

Submitted by خالد حسنى (not verified) on Wed, 22/03/2006 - 12:34pm.

هحاول ابعتلك الملف (أنا مش فى البيت)
بس الكراش من aspell مش من كتوب, وأنا جربته مع القاموس اللى عامله محصلش كراش.

وبالنسبة لكتوب أنا لاحظت انه مش بيدقق العربى بس بسيت أقول

Submitted by Talal (not verified) on Sat, 18/03/2006 - 10:51am.

و الله العظيم إني من أيام أقول إن الكميونتي العربي مقصر كثير في كثير من النواحي على الإنترنت و أنه أدور للمره الألف عن لستات كلمات عربية. و الحمدالله إني طلعت قلطان

المهم إني من سنه و أنا أدور على قاموس عربي أو لستة كلمات علشان أظمه لل Aspell و ما لقيت إلا لستات بلغات ثانيه

العرب إنشاالله فيهم الخير بس المشكله في تشتت المصادر على الإنترنت و البحث عنها مش سهل مثل اللغة الإنجليزية

و أخيرا اشكرك أخي كثيرا على هذا المجهود العظيم و الذي أدعو الله أن يضعه في ميزان حسناتك

Submitted by msameer on Sat, 18/03/2006 - 2:47pm.

العرب ولاد كلب و امحدش فيهم عمل ولا بيعمل ولا هايعمل حاجه

انا اهو و انت اهو و كلمتى اهى

لو الموقف ده اتغير ابقى تف على قبرى

اسف بس دى الحقيقه

و شكرا على دعواتك

Submitted by Shabayek (not verified) on Wed, 29/03/2006 - 9:15am.

الصبر يا طيب

قد يكون بعض العرب مثل ما قلت، لكن التعميم أكيد حيدخل بينا في دوائر لا فائدة منها.

المهم، ليس كل العرب على دراية وخبرة مثلك في اللينوكس (على قد حالنا - سامحنا) لكننا مهتمون بمدقق عربي مجاني.

لو كان طلبك تدقيق وتصحيح الكلمات العربية، فأنا لها، فقط أرسل لي ملفات للتدقيق، وبمشيئة الله أردها لك كما أرها، ولربما استعنت ببعض الأصدقاء

مع دعواتي لكم جميعاً بالتوفيق

Submitted by Osama (not verified) on Tue, 07/08/2007 - 1:17pm.

salam,
Hi, i am a software Eng. in Sunmicro systems CZ,i need a real good spell checker for AR, can u help me? plz.....

Submitted by msameer on Tue, 07/08/2007 - 6:11pm.

I don't know about any. Sorry.

Ask on Arabeyes.org

Post new comment
The content of this field is kept private and will not be shown publicly.
  • Allowed HTML tags: <a> <b> <dd> <dl> <dt> <i> <s> <li> <ol> <u> <ul> <br> <br /> <blockquote>
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.
  • You can use BBCode tags in the text. URLs will automatically be converted to links.
  • Lines and paragraphs break automatically.
  • You may write mixed Arabic and English freely, line direction will be computed automaticaly

More information about formatting options