Writings Photos Code Contact Resume
تدقيق املائى من كلمات المصحف الشريف

You are here

Submitted by msameer on Sat, 04/03/2006 - 1:10am

اوكى

بصراحه نفسى اقول كلام كتير لانى فى حالة من الضيق لا يتخيلها احد
المهم

ده ملف قاموس للمدقق الاملائى aspell انا عملته من نص القران الكريم

فك ضغط الملف فى "/usr/lib/aspell" او دور بنفسك aspell بيدور على القواميس فى انهى داهيه و لو ما عرفتش ولع فى نفسك و بطل تستخدم لينوكس يا حمار

كان هدفى ان اعمل قاموس عربى ل aspell علشان نتنيل نعرف نعمل تدقيق املائى للعربى "و الله نفسى اشتم بجد" لان ى اكتشفت ان بغداد مش هاينفع و هابقى اكتب بوست ليه مش هاينفع

اللى طلعها فى دماغى انى اقوم و اعملها رغم انى كنت ناوى ماعملهاش "لانى محبط من ال community العربى" اسلام.

المهم جبت كلمات المصحف كلها و عملت منها قاموس بس خد بالك لو هاتستعمله ان فيه كلمات كتير غلط هايعديها و يقول عليها صح علشان الرسم العثمانى بتاع المصحف

عمرو غربية وعدنى انى هايبعتلى ملفات صح و هاعمل منها قاموس ينفع للعربى المعاصر

و علشان كده انا مش هادى للناس ال ملفات الاصليه اللى عملت منها القاموس و اللى مش عاجبه يخبط دماغه فى الحيط

و مش عايز اى حد يسالنى على الداتا لانى مش هاديها لحد. اسف

يا رب نفسى اتخانق مع حد

Comments

Submitted by خالد حسمى (not verified) on Tue, 14/03/2006 - 12:06pm

أنا عملت word list من ملفات الداتا بتاعت بغداد (سكريبت عبيط طلع كل الكلمات العربى ورتبها أبجدى) بس كل المحاولات لعمل قاموس aspell منها منفعيتش وعمال يطلعلى أخطاء عن unsupported أو invalid charachter حتى لما خليته يتجاهل الأخطاء طلعلى قاموس ممنوش فايده ولما عملتله dump طلعلى كلمات مش عارفلها encoding

ممكن تقوللى ال ar.dat بتاعك عامل ازاى أو ازاى عملت القاموس بتاعك

وبعدين مستخدمتش الداتا بتاعت بغداد ليه ؟

Submitted by msameer on Tue, 14/03/2006 - 6:12pm

علشان فيها غلطات و كلمات قديمة و ماحدش عارف اد ايه

ممكن تبعتلى السكربت ؟

Submitted by خالد حسنى (not verified) on Thu, 16/03/2006 - 10:25am

عشان مبقاش كداب السكريبت أنا خدته من هنا http://cltb.net/ar/bash.html#10 (تانى واحد )

وتعديل بسيط عليه بقى حاجة زى كده

#!/bin/sh
    rm /tmp/glassory.txt.tmp 2>/dev/null
for i in "$@"
do
echo -n "processing [$i] ...    "
    cat $i | sed -e "s/[0-9A-Za-z\\\/\-\(\)"\'\`\~\,]/+/g" |
    tr A-Z a-z | tr -s "+" "\012" |
    sed -e "s/^[0-9\\\/ ]*//g" >> /tmp/wordlist.tmp
echo " OK "
done
echo -n "sorting ... "
    cat /tmp/wordlist.tmp | sort | uniq > ./wordlist
    rm /tmp/wordlist.tmp
echo "done!"

وبالمناسبة القاموس اللى عملته منها نفع دلوقتى وشغال بس مجربتوش كويس

Submitted by msameer on Sat, 18/03/2006 - 12:45pm

اعتقد السكربت ده مش هاينفع لان قاعدة بيانات بغداد مش سهله كده

لو عايز شرح اكتر اقولك تقرا فين

Submitted by خالد حسنى (not verified) on Tue, 21/03/2006 - 12:20pm

أنا معرفش وجهة نظرك ايه بس انا عملت قاموس شغال نص نص (نص الكلمات بيطلعها غلط يعنى مالوش لازمة)

وياريت تقولى اقرى فين (انا قريت ال info بتاعت aspell بس مأسعفتنيش أوى)

وبعدين أنا شاكك أن aspell هيشتغل كويس مع العربى , انت فلهم الفرق بين العربى والإنجليزى بس نحاول

وعلى فكرة القاموس بتاعك بيكراش aspell لما بشغله مع ملف عربى-انجليزى (حتى كتوب عمل كراش منها)

Submitted by msameer on Tue, 21/03/2006 - 12:56pm

طب انا هاوصفلك الداتا بتاعة بغداد و دؤلى بس بالعنجليزى معلش بقه ;-)

The database is composed of 6 tables:
1) prefixes
2) suffixes
3) stems

plus three other compatibility tables
4) valid prefixes-stems
5) valid stems-suffixes
6) valid prefixes-stems

so in order for a word to be valid it must be broken to a stem + a prefix + a suffix and all three of them must be in the corresponding tables and they must be compatible paer the tables 4,5,6

الناس بتوع aspell بيقولوا انه هايشتغل و انا جربت بنفسى و اشتغل

بالنسبه للكراش فكتوب اللى معاك مش هايخلى aspell يدقق العربى

استعمل ال CVS احسن

cvs -z3 -d:pserver:anonymous@home.foolab.org:/var/lib/cvs co projects/katoob

ممكن تبعتلى الملف اللى عمل كراش ؟ لو عرفت اخليه يعمل كراش اقدر اصلح ال bug

Submitted by خالد حسنى (not verified) on Wed, 22/03/2006 - 10:34am

هحاول ابعتلك الملف (أنا مش فى البيت)
بس الكراش من aspell مش من كتوب, وأنا جربته مع القاموس اللى عامله محصلش كراش.

وبالنسبة لكتوب أنا لاحظت انه مش بيدقق العربى بس بسيت أقول

Submitted by Talal (not verified) on Sat, 18/03/2006 - 8:51am

و الله العظيم إني من أيام أقول إن الكميونتي العربي مقصر كثير في كثير من النواحي على الإنترنت و أنه أدور للمره الألف عن لستات كلمات عربية. و الحمدالله إني طلعت قلطان

المهم إني من سنه و أنا أدور على قاموس عربي أو لستة كلمات علشان أظمه لل Aspell و ما لقيت إلا لستات بلغات ثانيه

العرب إنشاالله فيهم الخير بس المشكله في تشتت المصادر على الإنترنت و البحث عنها مش سهل مثل اللغة الإنجليزية

و أخيرا اشكرك أخي كثيرا على هذا المجهود العظيم و الذي أدعو الله أن يضعه في ميزان حسناتك

Submitted by msameer on Sat, 18/03/2006 - 12:47pm

العرب ولاد كلب و امحدش فيهم عمل ولا بيعمل ولا هايعمل حاجه

انا اهو و انت اهو و كلمتى اهى

لو الموقف ده اتغير ابقى تف على قبرى

اسف بس دى الحقيقه

و شكرا على دعواتك

Submitted by Shabayek (not verified) on Wed, 29/03/2006 - 7:15am

الصبر يا طيب

قد يكون بعض العرب مثل ما قلت، لكن التعميم أكيد حيدخل بينا في دوائر لا فائدة منها.

المهم، ليس كل العرب على دراية وخبرة مثلك في اللينوكس (على قد حالنا - سامحنا) لكننا مهتمون بمدقق عربي مجاني.

لو كان طلبك تدقيق وتصحيح الكلمات العربية، فأنا لها، فقط أرسل لي ملفات للتدقيق، وبمشيئة الله أردها لك كما أرها، ولربما استعنت ببعض الأصدقاء

مع دعواتي لكم جميعاً بالتوفيق

Submitted by Osama (not verified) on Tue, 07/08/2007 - 11:17am

salam,
Hi, i am a software Eng. in Sunmicro systems CZ,i need a real good spell checker for AR, can u help me? plz.....

Submitted by msameer on Tue, 07/08/2007 - 4:11pm

I don't know about any. Sorry.

Ask on Arabeyes.org

Add new comment

Subscribe to /  digg  bookmark