यह आपको थिसॉरस खोजने की अनुमति देता है। थिसॉरी। सूचना पुनर्प्राप्ति कार्यों के लिए

विषय क्षेत्र की वैचारिक प्रणाली किसी भी विषय क्षेत्र का आधार इस क्षेत्र की अवधारणाओं की प्रणाली है। एक अवधारणा की परिभाषा: एक अवधारणा एक ऐसा विचार है जो वास्तविकता की वस्तुओं और घटनाओं को उनके गुणों और संबंधों को तय करके एक सामान्यीकृत रूप में दर्शाता है; उत्तरार्द्ध (गुण और संबंध) अवधारणा में वस्तुओं और घटनाओं के वर्गों के साथ सहसंबद्ध सामान्य और विशिष्ट विशेषताओं के रूप में प्रकट होते हैं (भाषाई शब्दकोश)


किसी विषय क्षेत्र की अवधारणा को पाठों में व्यक्त करने के लिए अवधारणाओं और शब्दों का प्रयोग शब्दों या वाक्यांशों में किया जाता है जिन्हें शब्द कहते हैं। विषय क्षेत्र की शर्तों का समूह इसकी शब्दावली प्रणाली बनाता है। विषय क्षेत्र की शब्द प्रणाली की अन्य शर्तों के साथ एक विशिष्ट शब्द का संबंध परिभाषा द्वारा दिया गया है


शब्द की परिभाषा? एक शब्द (या शब्दों का संयोजन) जो विज्ञान, प्रौद्योगिकी, कला, सामाजिक जीवन आदि के किसी विशेष क्षेत्र की एक निश्चित अवधारणा का सटीक पदनाम है। || किसी बात को दर्शाने के लिए प्रयुक्त होने वाला विशेष शब्द या भाव। एक विशेष वातावरण में, पेशा (रूसी भाषा का बड़ा व्याख्यात्मक शब्दकोश)


शर्तें - अवधारणाओं के सटीक नाम आमतौर पर, क्षेत्र की प्रत्येक अवधारणा कम से कम एक स्पष्ट रूप से समझे जाने वाले शब्द से मेल खाती है, जिसका अर्थ यह अवधारणा है। - शब्द, शब्दावली के पारंपरिक सिद्धांत के अर्थ में शब्दों के गुण - अवधारणाओं के सटीक नाम - शब्द को सीधे अवधारणा को संदर्भित करना चाहिए, इसे अवधारणा को स्पष्ट रूप से व्यक्त करना चाहिए; - शब्द का अर्थ सटीक होना चाहिए और अन्य शब्दों के साथ अर्थ में ओवरलैप नहीं होना चाहिए; - शब्द का अर्थ संदर्भ पर निर्भर नहीं होना चाहिए। शब्द जो एक अवधारणा को सटीक रूप से नाम देते हैं, शब्दावली के सिद्धांत के अध्ययन का विषय हैं, शब्दावली


टेक्स्ट शब्द विषय क्षेत्र के वास्तविक ग्रंथों में, मुख्य शब्दों के अलावा, अवधारणा को संदर्भित करने के लिए विभिन्न भाषा अभिव्यक्तियों का उपयोग किया जा सकता है, जिसे हम टेक्स्ट शब्द कहते हैं: - वाक्यात्मक और शब्द-निर्माण विकल्प: बजट निधि प्राप्त करने वाला - बजट प्राप्तकर्ता; - शाब्दिक रूपांतर - प्रत्यक्ष राइट-ऑफ़, निर्विवाद राइट-ऑफ़; - बहु-मूल्यवान भाव, संदर्भ के आधार पर, क्षेत्र की विभिन्न अवधारणाओं के संदर्भ के रूप में कार्य करते हैं, उदाहरण के लिए, विभिन्न संदर्भों में मुद्रा शब्द का अर्थ राष्ट्रीय मुद्रा या विदेशी मुद्रा हो सकता है।














लेबल किए गए डिस्क्रिप्टर लेबल - डिस्क्रिप्टर क्रेन (उठाने के उपकरण) बनाम क्रेन (पक्षी) के गोले (संरचना) के नाम का हिस्सा - वाक्यांशों के लिए विभिन्न थिसॉरी प्राथमिकताएं की तुलना: -फोनोग्राफ रिकॉर्ड बनाम। रिकॉर्ड (फोनोग्राफ) कूड़े और बहुवचन: लकड़ी (सामग्री) लकड़ी (जंगली क्षेत्र)






बहु-शब्द अभिव्यक्तियों के आधार पर वर्णनकर्ताओं का समावेश एक शब्द को विभाजित करने से अस्पष्टता बढ़ जाती है: पौधे का भोजन अभिव्यक्ति का अर्थ शब्द क्रम पर निर्भर करता है: सूचना विज्ञान - वैज्ञानिक जानकारी घटक शब्दों में से एक थिसॉरस के दायरे से बाहर है या बहुत सामान्य है: पहला सहायता विवरणक संबंध इसकी संरचना से नहीं चलते हैं: -कृत्रिम गुर्दे, शरणार्थी की स्थिति, ट्रैफिक लाइट




सहयोगी संबंध गतिविधि का क्षेत्र - चरित्र - गणित - गणितज्ञ अनुशासन - अध्ययन की वस्तु - तंत्रिका विज्ञान - तंत्रिका तंत्र क्रिया - एजेंट या उपकरण - शिकार - शिकारी क्रिया - क्रिया का परिणाम - बुनाई - कपड़ा क्रिया - लक्ष्य - बंधन - पुस्तक कारण-प्रभाव - मृत्यु - अंतिम संस्कार मूल्य - माप की इकाई - वर्तमान शक्ति - एम्पीयर एक्शन - प्रतिपक्ष - एलर्जेन - एंटी-एलर्जी दवा, आदि।


सूचना पुनर्प्राप्ति थिसॉरी: विकास के चरण चरण एक: अनुक्रमणिका मनमाना शब्दों और वाक्यांशों के साथ पाठ के मुख्य विषय का वर्णन करती है कई ग्रंथों से प्राप्त शर्तें एक साथ लाई जाती हैं अर्थ में करीब शब्दों के बीच, सबसे अधिक प्रतिनिधि चुना जाता है शेष कुछ बन जाते हैं सशर्त समानार्थक शब्द, शेष हटा दिए जाते हैं विशिष्ट शब्द आमतौर पर शामिल नहीं होते हैं


सूचना पुनर्प्राप्ति थिसॉरी: डिज़ाइन की कला डिस्क्रिप्टर ऐसे शब्द हैं जो दस्तावेज़ के मुख्य विषय को व्यक्त करने के लिए आवश्यक हैं समानार्थी शब्द केवल सबसे आवश्यक शामिल हैं (उदाहरण के लिए, एक अलग अक्षर से शुरू करें) ताकि इंडेक्सर के काम में बाधा न आए। विषयवस्तु अनुक्रमण से बचने के लिए शब्दों को एक पद तक कम किया जाना चाहिए पदानुक्रम स्तर, विशिष्ट शब्दों का समावेश सीमित है


सूचना पुनर्प्राप्ति थिसॉरस: विकास की कला - 2 जटिल मामलों में, वर्णनकर्ताओं को लेबल और टिप्पणियों के साथ आपूर्ति की जाती है -LIV: बमबारी - बमबारी - अस्पष्ट शब्द: थिसॉरस (राजधानी) में एक मान, थिसॉरस, लेबल में फिट नहीं होता है !!! पारंपरिक सूचना पुनर्प्राप्ति थिसॉरस - वास्तविक शब्दों के आधार पर निर्मित एक कृत्रिम भाषा




पारंपरिक आईपीटी: स्वचालित प्रसंस्करण में आवेदन सॉफ्टवेयर की वास्तविक भाषा के ज्ञान की कमी सॉफ्टवेयर की वास्तविक भाषा के ज्ञान की कमी विधायी अनुक्रमण शब्दावली: विधायी अनुक्रमण शब्दावली: - पाठ में ट्रूप्स - थिसॉरस सैन्य बलों में - पाठ में कैपिटल - कैपिटल, थिसॉरस में केवल राजधानी सुझाई गई: प्रत्येक डिस्क्रिप्टर शब्दों और शब्दों की सूचियों के साथ पूरक है: प्रत्येक डिस्क्रिप्टर को शब्दों और शब्दों की सूचियों के साथ पूरक किया जाना चाहिए लेकिन: पॉलीसेमी या विभिन्न डिस्क्रिप्टर से संबंधित। लेकिन: पॉलीसेमी या विभिन्न वर्णनकर्ताओं से संबंधित। अस्पष्टता का समाधान अस्पष्टता का समाधान


पारंपरिक आईपीटी: स्वचालित क्वेरी विस्तार संघों के साथ समस्या सुझाई गई: वजन दर्ज करें वजन दर्ज करें संबंध नाम दर्ज करें: वस्तु, संपत्ति, आदि। संबंधों के नाम दर्ज करें: वस्तु, संपत्ति, आदि। निष्कर्ष: आपको विशेष रूप से पाठ संग्रह के स्वचालित प्रसंस्करण के लिए भाषाई संसाधनों का निर्माण करना सीखना होगा


थिसॉरस EUROVOC - यूरोपीय समुदाय के बहुभाषी थिसॉरस 9 भाषाओं में थिसॉरस EUROVOC का रूसी संस्करण - +5 हजार अवधारणाएं जो रूसी विशिष्टताओं को दर्शाती हैं बहुभाषी थिसॉरस - डिस्क्रिप्टर - विभिन्न भाषाओं में नाम -एस्क्रिप्टर - कुछ भाषाओं के लिए


EUROVOC थिसॉरस (Hlava, Heinebach, 1996) पर नियम-आधारित स्वचालित अनुक्रमण नियम उदाहरण: IF ("प्रौद्योगिकी" के पास और "विकास" के साथ) सामुदायिक कार्यक्रम का उपयोग करें विकास सहायता का उपयोग करें ENDIF 40 हजार नियम। परीक्षण: पाठ में 20 सबसे लगातार वर्णनकर्ता, स्वचालित रूप से उत्पन्न - मैन्युअल वर्गीकरण की तुलना में 42% पूर्णता


शब्दों और वर्णनकर्ताओं के बीच पत्राचार भार स्थापित करने के आधार पर स्वचालित अनुक्रमण (स्टाइनबर्गर एट अल।, 2000) चरण 1 - सांख्यिकीय उपायों (ची-स्क्वायर या लॉग-संभावना) के आधार पर टेक्स्ट शब्दों और असाइन किए गए वर्णनकर्ताओं के बीच एक पत्राचार स्थापित करना मत्स्य प्रबंधन विवरणक - निम्नलिखित शब्द (वजन के अवरोही क्रम में): मत्स्य पालन, मछली, स्टॉक, मछली पकड़ना, संरक्षण, प्रबंधन, पोत, आदि। दूसरा चरण स्वयं अनुक्रमण - भार के लघुगणक का योग या वैक्टर के अदिश उत्पाद के रूप में


मुफ़्त और सूचना पुनर्प्राप्ति थिसॉरस प्रश्नों का संयोजन मैन्युअल रूप से अनुक्रमित संग्रह - सहसंबंध उपयोगकर्ता प्राकृतिक भाषा क्वेरी सेट करता है क्वेरी को थिसॉरस डिस्क्रिप्टर द्वारा विस्तारित किया जाता है जो क्वेरी के साथ सबसे अधिक सहसंबद्ध होता है (पेट्रास 2004; पेट्रास 2005)। उदाहरण के लिए, दिवालिया कंपनियों (दिवालिया कंपनियों) के अनुरोध पर, विवरणकर्ताओं की तरलता, ऋणग्रस्तता, उद्यम, फर्म की एक सूची प्राप्त की जा सकती है, और क्वेरी का विस्तार किया जाता है। प्रयोग में सटीकता में 13% की वृद्धि हुई।



कोश(ग्रीक थिसॉरोस से - खजाना) आधुनिक भाषाविज्ञान में - सामान्य या विशेष शब्दावली के एक विशेष प्रकार के शब्दकोश, जो शाब्दिक इकाइयों के बीच शब्दार्थ संबंधों (समानार्थक, विलोम, पर्यायवाची, सम्मोहन, हाइपरनिम्स, आदि) को इंगित करते हैं। इस प्रकार, थिसॉरी, विशेष रूप से इलेक्ट्रॉनिक प्रारूप में, व्यक्तिगत विषय क्षेत्रों का वर्णन करने के लिए सबसे प्रभावी उपकरणों में से एक है।

एक व्याख्यात्मक शब्दकोश के विपरीत, थिसॉरस आपको न केवल एक परिभाषा की मदद से, बल्कि अन्य अवधारणाओं और उनके समूहों के साथ एक शब्द को सहसंबंधित करके भी अर्थ की पहचान करने की अनुमति देता है, जिसके कारण इसका उपयोग कृत्रिम बुद्धि प्रणालियों में किया जा सकता है।

अतीत में, शब्द थिसॉरस मुख्य रूप से ऐसे शब्दकोशों को निरूपित करता था जो ग्रंथों में इसके उपयोग के उदाहरणों के साथ भाषा की शब्दावली को अधिकतम पूर्णता के साथ दर्शाते थे।

परोनिमी- उनके शब्दार्थ अंतर (पूर्ण या आंशिक) के साथ शब्दों की आंशिक ध्वनि समानता। समानार्थी शब्द अक्सर भाषण त्रुटियों का एक स्रोत होते हैं।

सिंगल-रूट पैरोनिम्स के उदाहरण: ड्रेस - पुट ऑन, ह्यूमन - ह्यूमेन, पे - पे - पे।

पूरी तरह से असंबंधित समानार्थक शब्द के उदाहरण: जीव विज्ञान - ब्रायोलॉजी, शोरबा - ब्रिलन, कॉम्पोट - कॉम्पोट, बनावट - फ्रैक्चर।

हालाँकि, एक थिसॉरस एक सूचना पुनर्प्राप्ति उपकरण से अधिक है। थिसॉरस को शब्दावली प्रणाली का एक सार्वभौमिक मॉडल माना जा सकता है, और इसलिए - एक विशेष वैज्ञानिक क्षेत्र की भाषा में निहित ज्ञान की औपचारिक प्रणाली के रूप में।

सामान्य प्रयोजन थिसॉरस

सबसे सामान्य परिभाषा में थिसॉरस शब्दावली इकाइयों के बीच अर्थ संबंधी लिंक वाला एक शब्दकोश है। 1950 के दशक के उत्तरार्ध से, मशीन अनुवाद प्रणाली और सूचना पुनर्प्राप्ति प्रणाली (IPS) में थिसॉरी का उपयोग किया गया है।

शब्दार्थ शब्दकोशों के विपरीत, जिन्हें सामान्य शब्दावली का विस्तार से वर्णन करने के लिए डिज़ाइन किया गया है, थिसॉरी को अत्यंत विशिष्ट शब्दों और वाक्यांशों को संग्रहीत और वर्गीकृत करने के लिए डिज़ाइन किया गया है। उदाहरण के लिए, शब्द पदार्थआरओएसएस डिक्शनरी (रूसी जनरल सिमेंटिक डिक्शनरी) में है, और रासायनिक यौगिकों के सभी नाम पहले से ही थिसॉरस में हैं।

थिसॉरस में किन संबंधों का वर्णन किया गया है? आमतौर पर:

    जीनस-प्रजाति (एकेओ)

    अंश-संपूर्ण (पीओएफ)

    पर्यायवाची / विलोम शब्द

    सहयोगी।

एक जीनस-प्रजाति संबंध का एक उदाहरण

सिमेंटिक पार्सिंग उदाहरण

यह निदर्शनात्मक(स्थिर कनेक्शन जो किसी भाषा में शब्दों के बीच मौजूद होते हैं)। और अभी यह समाप्त नहीं हुआ है।

वाक्य-विन्यास(पाठ) लिंक थिसॉरस में प्रदर्शित नहीं होते हैं।

उदाहरण: वर्डनेट - बुद्धिमान कंप्यूटर थिसॉरस

http://wordnet.princeton.edu/perl/webwn

प्रिंसटन विश्वविद्यालय में बनाया गया और स्वतंत्र रूप से वितरित किया गया।

प्रमुख विशेषताऐं।

इसमें शब्दों को समानार्थी समूहों में बांटा गया है ( सिनसेट्स - सिनसेट्स) वे 4 शब्दकोशों में विभाजित हैं - संज्ञा, विशेषण, क्रिया और क्रिया विशेषण।

Synsets दोनों पदानुक्रमित संबंधों (हाइपोनिम्स और हाइपरनिम्स) में एकजुट होते हैं, और एंटोनिमी के संबंध में और मेरोनीमी (किसी चीज का हिस्सा बनने के लिए या भागों से मिलकर) दोनों में एकजुट होते हैं।

आकृति विज्ञान की समस्या भी हल हो जाती है - WN को कॉल करने के बाद शब्द अपने मूल रूप में वापस आ जाता है।

सूचना पुनर्प्राप्ति थिसॉरस

सूचना पुनर्प्राप्ति के क्षेत्र में, थिसॉरी को पाठ से वर्णनकर्ताओं में संक्रमण से लाभ होता है जो वास्तविक दुनिया की वस्तु का वर्णन करते हैं। डिस्क्रिप्टर पर जाने से विस्तारित (अनावश्यक) अनुक्रमण की अनुमति मिलती है।

सूचना पुनर्प्राप्ति थिसॉरस में, वर्णनकर्ताओं के बीच PARADIGMATIC संबंध स्पष्ट रूप से व्यक्त किए जाते हैं (सभी नहीं, लेकिन वे जो सूचना पुनर्प्राप्ति की पूर्णता को बढ़ाने के लिए अक्सर महत्वपूर्ण होते हैं)। यह प्रयोगात्मक रूप से निर्धारित किया गया है कि सबसे महत्वपूर्ण प्रतिमान संबंध हैं

    अधीनता

    सादृश्य

    प्रजाति-जीनस (जीनस-प्रजाति)

    कारण प्रभाव

    अंश-संपूर्ण।

शब्दकोश प्रविष्टि का उदाहरण:

एग्रीकल्चरल मशीनें। एग्रीकल्चरल इक्विपमेंट

सिन। कृषि मशीनरी, कृषि मशीनरी,

राय: आलू की फसल काटने की मशीन, बीजक, आदि।

निरर्थक अनुक्रमण का एक उदाहरण

प्रार्थना "एग्रीकल्चरल मशीनें। एग्रीकल्चरल इक्विपमेंट"

उदाहरण: रूसी भाषा विश्वविद्यालय सूचना प्रणाली रूस का सामाजिक-राजनीतिक थिसॉरस

http://www.cir.ru/index.jsp

स्वायत्त गैर-लाभकारी संगठन "सूचना अनुसंधान केंद्र" (ANO TsII) द्वारा विकसित

थिसॉरस एक शब्दावली संसाधन है जिसे अवधारणाओं और शब्दों के शब्दकोश के रूप में लागू किया जाता है, जिसमें उनके बीच संबंध होते हैं। थिसॉरस का मुख्य उद्देश्य सूचना पुनर्प्राप्ति में मदद करना है: थिसॉरस के लिंक के आधार पर, क्वेरी का विस्तार किया जाता है, थिसॉरस के लिंक के माध्यम से नेविगेशन क्वेरी को और अधिक स्पष्ट रूप से तैयार करने में मदद करता है।

थिसॉरस यूआईएस "रूस" के पदानुक्रम की एक विशेषता वर्गीकरण की बहुलता है, अर्थात, अधिकांश अवधारणाओं के लिए, एक भी वर्गीकरण अवधारणा की खोज नहीं की जाती है (ऊपर - नीचे कनेक्शन), लेकिन एक विशेष अवधारणा पर विभिन्न दृष्टिकोण हैं वर्णित है, उदाहरण के लिए, एक दुकान की अवधारणा को एक भवन और एक व्यापारिक संगठन दोनों के रूप में माना जा सकता है।

सामाजिक-राजनीतिक विषयों पर थिसॉरस में 26,000 से अधिक अवधारणाएं, 62,000 शब्द, 100,000 प्रत्यक्ष और 700,000 अवधारणाओं के बीच विरासत में मिले संबंध शामिल हैं। थिसॉरस का वर्तमान संस्करण आर्थिक, राजनीतिक, सैन्य, विधायी, सामाजिक, अंतर्राष्ट्रीय संबंधों और अन्य क्षेत्रों सहित सामाजिक-राजनीतिक क्षेत्र में प्रयुक्त शब्दावली का वर्णन करता है।

थिसॉरस का पूरा नाम स्वचालित अनुक्रमण के लिए सामाजिक-राजनीतिक विषयों पर एक सूचना पुनर्प्राप्ति थिसॉरस है। यहाँ सभी परिभाषाएँ महत्वपूर्ण हैं:

    "सूचना पुनर्प्राप्ति" - जैसा कि यह विशेष रूप से सूचना पुनर्प्राप्ति में उपयोग के लिए डिज़ाइन किया गया है ताकि उपयोगकर्ता को अनुरोध के गठन (स्पष्टीकरण) में मदद मिल सके और खोज के दौरान अनुरोध की शर्तों को स्वचालित रूप से विस्तारित किया जा सके;

    "सामाजिक-राजनीतिक विषयों पर" - क्योंकि इसमें सामाजिक-राजनीतिक विषयों पर रूसी भाषा के पाठ की शब्दावली और शब्दावली का 95-99% शामिल है;

    "स्वचालित अनुक्रमण के लिए" - चूंकि यह दस्तावेज़ों की विषय वस्तु के स्वत: निर्धारण की प्रक्रिया का आधार है - थिसॉरस पदानुक्रम में बंद शब्दों को विषयगत नोड्स, स्वचालित वर्गीकरण और स्वचालित एनोटेशन में समूहीकृत करना।

थिसौरी - निष्कर्ष

कई प्रसिद्ध थिसॉरी (वर्डनेट, रोजेट, यूरोवर्डनेट) के लिए, थिसॉरस लिंक द्वारा स्वचालित अनुमान एक बड़ी समस्या बनी हुई है - जब निकटतम पड़ोस में विस्तार सही है, लेकिन पूर्ण नहीं है, और पड़ोस का विस्तार करने का प्रयास त्रुटियों को जन्म देता है।

TAOY KemGUKI विभाग

सूचना पुनर्प्राप्ति थिसॉरी:

संरचना, उद्देश्य और विकास प्रक्रिया

1. थिसॉरस ज्ञान के व्यवस्थित प्रतिनिधित्व के एक तरीके के रूप में और

एक प्रकार का वैचारिक शब्दकोश।

2. सूचना पुनर्प्राप्ति थिसॉरी: सार और उद्देश्य

3. आईपीटी की संरचना

4. आईपीटी के विकास, परीक्षा, पंजीकरण और रखरखाव की प्रक्रिया।

ग्रन्थसूची

1. GOST 7.74 - 96. सूचना पुनर्प्राप्ति भाषाएँ। नियम और परिभाषाएँ [पाठ]। - इनपुट। 1997-07-01। - मिन्स्क: मानकीकरण, मेट्रोलॉजी और 1997 के लिए अंतरराज्यीय परिषद। - 34 पी। (सूचना, पुस्तकालय और प्रकाशन के लिए मानकों की प्रणाली) टीसी 191।

2. गोस्ट 7.25-2001। थिसॉरस सूचना पुनर्प्राप्ति मोनोलिंगुअल। विकास नियम, संरचना, और प्रस्तुति प्रपत्र [पाठ]। - गोस्ट 7.25-80; परिचय 2002-07-01। - एम .: आईपीके पब्लिशिंग हाउस ऑफ स्टैंडर्ड्स, 2001. - 16 पी। एमटीके 191.

3. GOST 7.24-2007 बहुभाषी सूचना पुनर्प्राप्ति थिसॉरस। निर्माण के लिए संरचना, संरचना और बुनियादी आवश्यकताएं। - GOST 7.24-90 के बजाय; इनपुट। 2008-07-01। / मानकीकरण, मेट्रोलॉजी और प्रमाणन के लिए अंतरराज्यीय परिषद। - एम .: स्टैंडआर्टिनफॉर्म, 2008. - 7 पी। (सूचना, पुस्तकालय और प्रकाशन पर मानकों की प्रणाली)

4. बारानोव, ओ.एस. रूसी भाषा का आइडियोग्राफिक डिक्शनरी / ओ.एस. बारानोव। - एम .: ईटीएस पब्लिशिंग हाउस, 1995. - 820 s

5. ज़मेलो, एस.वी. थिसॉरस की परिभाषा पर [पाठ] / एस.वी. // एनटीआई। सेवा 1 संगठन और सूचना कार्य। - 2003. - नंबर 12। - पी.20 - 25।

6. Zhmailo, S. V. आधुनिक सूचना पुनर्प्राप्ति थिसॉरी का विकास [पाठ] / S. V. Zhmailo // NTI। सेवा 1 सूचना कार्य का संगठन और कार्यप्रणाली। -2004। - नंबर 1। - पी.23 - 31।

तो, ओ.एस. बारानोव (4) द्वारा रूसी भाषा के वैचारिक शब्दकोश में, वैचारिक शब्दकोश के 12 उच्च खंड प्रतिष्ठित हैं, जिनमें से हैं: "आदेश, प्रकृति, गतिविधि, संस्कृति", आदि, जिनमें से प्रत्येक को विभाजित किया गया है समूहों, उपसमूहों, विभागों, वर्गों। इस शब्दकोश के सभी शब्दों को उनके अर्थ के अनुसार घोंसलों में वर्गीकृत किया गया है और कुछ अवधारणा द्वारा समूहीकृत किया गया है, जिसके साथ वे अक्सर प्रजातियों के संबंधों से जुड़े होते हैं। घोंसलों को उपखंडों में बांटा गया है और इसी तरह। फिलहाल, शब्दकोश में 5923 घोंसले हैं, 7 डिवीजन स्तर (www.rifmovnik.ru/thesaurus.htm के अनुसार फरवरी 16, 2010)। इस शब्दकोश से शब्दकोश प्रविष्टि का एक उदाहरण यहां दिया गया है:

178.4.7 सुगंध ▲ - एक सुखद गंध (उदाहरण के लिए, फूलों की गंध, घास, घास। कोमल #। नशीला #)। सुगन्धित करना। . . अम्ब्रे धूप

शब्द "सुगंध" का कोड इस दिए गए शब्द में स्वीकृत वैचारिक वर्गीकरण को दर्शाता है, विशेष रूप से, "178-सेंसेशन" श्रेणी के साथ इस शब्द का सहसंबंध।

इस प्रकार, शब्द "थिसॉरस", "आइडियोग्राफिक डिक्शनरी", "थिसॉरस-टाइप डिक्शनरी" का सबसे पहले अर्थ यह है कि भाषा के शब्दों की समग्रता इस तरह से प्रस्तुत की जाती है कि शब्दों के एक समूह में ऐसे शब्द शामिल हों जो समान हों अर्थ में। विचारधारात्मक शब्दकोशों का मुख्य उद्देश्य एक सामान्य अवधारणा द्वारा एकजुट शाब्दिक इकाइयों का संग्रह है; यह पाठक के लिए विचार की पर्याप्त अभिव्यक्ति के लिए सबसे उपयुक्त साधन खोजना आसान बनाता है और भाषा के सक्रिय उपयोग में योगदान देता है।

थिसॉरी के इतिहास से

जैकेट 2302

सूट में

कोट उत्पाद

सिलाई उत्पाद

n डबल ब्रेस्टेड जैकेट

संयुक्त जैकेट

खेल जैकेट

पैकिंग उपायों में

शेष सामग्री

अपशिष्ट पदार्थ

लेक्सिकल नोट;

एस्क्रिप्टर या डिस्क्रिप्टर-पर्यायवाची;

सुपीरियर डिस्क्रिप्टर;

डाउनस्ट्रीम डिस्क्रिप्टर;

सहयोगी वर्णनकर्ता;

अन्य प्रकार के संबंधों से जुड़े वर्णनकर्ता।

एक प्रकार के प्रतिमान संबंध द्वारा एक हेड डिस्क्रिप्टर से जुड़े एलयू के प्रत्येक समूह के भीतर, व्यवस्था का एक वर्णानुक्रमिक क्रम होना चाहिए। उदाहरण के लिए:

एल्गोरिथम भाषाएं

एल्गोरिथम भाषाओं के साथ

मशीन-उन्मुख भाषाएँ

डोमेन-विशिष्ट भाषाएं

सॉफ्टवेयर में

औपचारिक भाषाएं

एन ऑटोकोड

एक एल्गोरिदम

प्रोग्रामिंग cf. कृत्रिम भाषाएं

एक एस्क्रिप्टर प्रविष्टि में एक एस्क्रिप्टर और डिस्क्रिप्टर या डिस्क्रिप्टर का एक संयोजन होता है जो सूचना को संसाधित और खोजते समय इसे बदल देता है। यहाँ एस्क्रिप्टर लेखों के उदाहरण दिए गए हैं:

अक्षरांकीय वर्ण

स्पेनिश औपचारिक भाषाएं

प्राकृतिक भाषाएं

एल्गोरिथम भाषाएं देखें

एक शब्दकोश प्रविष्टि में यह भी शामिल हो सकता है:

कितनी बार डिस्क्रिप्टर का उपयोग किया जाता है;

डिस्क्रिप्टर कोड नंबर;

व्यवस्थित सूचकांक के अनुसार डिस्क्रिप्टर कोड;

वर्गीकरण सूचकांक;

अतिरिक्त शब्दार्थ और शब्दावली चिह्न;

विदेशी समकक्ष।

लेक्सिको-सिमेंटिक इंडेक्स की गुणवत्ता इसमें शामिल शाब्दिक इकाइयों की पूर्णता से निर्धारित होती है। किसी दिए गए विषय क्षेत्र के लिए सूचनात्मक रूप से सार्थक शब्द को थिसॉरस में प्रवेश करने की संभावना के रूप में समझा जाता है। लेक्सिको-सिमेंटिक इंडेक्स की पूर्णता, और, परिणामस्वरूप, संपूर्ण थिसॉरस का अनुक्रमण दस्तावेजों और प्रश्नों के परिणामों पर महत्वपूर्ण प्रभाव पड़ता है।

अतिरिक्त भागों में व्यवस्थित, क्रमपरिवर्तनीय, पदानुक्रमित और अन्य अनुक्रमित और शाब्दिक इकाइयों की विशेष श्रेणियों की सूची शामिल हो सकती है।

एक व्यवस्थित सूचकांक एक ऐसा सूचकांक है जिसमें आईपीटी में स्वीकृत शीर्षकों के अनुसार वर्णनकर्ताओं को समूहीकृत किया जाता है। एक व्यवस्थित सूचकांक थिसॉरस विषयगत दिशा को परिभाषित करता है, इसकी सामग्री को प्रकट करता है और विज्ञान और प्रौद्योगिकी की उन शाखाओं को दर्शाता है जिन्हें विस्तार की एक या दूसरी गहराई के साथ खोजा जा सकता है। आईपीटी के हिस्से के रूप में इसकी आवश्यकता इस तथ्य के कारण है कि यह ज्ञान के एक विशेष क्षेत्र में शब्दावली की सामान्य स्थिति का एक दृश्य प्रतिनिधित्व देता है, आपको एक सुसंगत शब्दावली मॉडल बनाने की अनुमति देता है और, यदि संभव हो तो, सभी शर्तें और अवधारणाएं जिन्हें थिसॉरस में जगह मिलनी चाहिए। इसका उद्देश्य विषय के अनुसार डिस्क्रिप्टर और एस्क्रिप्टर के एक सेट को ऑर्डर करके दस्तावेजों और प्रश्नों की खोज छवियों को संकलित करते समय शब्दों की खोज को सुविधाजनक बनाना है।

व्यवस्थित सूचकांक, संक्षेप में, शब्दावली के साथ थिसॉरस को भरने के लिए एक वर्गीकरण योजना है, क्योंकि यह विषय क्षेत्रों के अनुसार वर्णनकर्ताओं के एक सेट को ऑर्डर करके बनाया गया है।

IPT के व्यवस्थित अनुक्रमित तीन प्रकारों में विभाजित हैं:

विषयगत,

मिश्रित।

यह विभाजन एक व्यवस्थित सूचकांक की वर्गीकरण योजना के निर्माण के सिद्धांत को दर्शाता है।

आईपीटी के व्यवस्थित सूचकांक द्वारा किए जाने वाले मुख्य कार्य:

अनुक्रमण में एक सहायक के रूप में उपयोग करें, प्रदान करना, कुल मिलाकर, अनुक्रमणिका अवधारणाओं के लिए वर्णनकर्ताओं की खोज करना जो थिसॉरस (खोज फ़ंक्शन) में स्पष्ट रूप से प्रतिनिधित्व नहीं करते हैं;

थिसॉरस बनाए रखने की प्रक्रिया में उपयोग करें (आईपीटी को बनाए रखने का कार्य);

इसके विकास (रचनात्मक कार्य) के प्रबंधन के रूप में आईपीटी के संरचनात्मक आधार के रूप में उपयोग करें।

GOST 7.25-2001 (2) के अनुसार, विषयगत और मिश्रित प्रकारों के एक व्यवस्थित सूचकांक का निर्माण करते समय, इसके विषयगत भाग में, अंतरराज्यीय NTI रूब्रिकेटर के रूब्रिक या अंतरराज्यीय NTI रूब्रिकेटर के साथ संगत एक विशिष्ट ASNTI रूब्रिकेटर का उपयोग किया जाना चाहिए। श्रेणीबद्ध और मिश्रित प्रकारों के एक व्यवस्थित सूचकांक का निर्माण करते समय, निम्नलिखित सामान्य श्रेणियां इसके स्पष्ट भाग में आती हैं:

विषयों और गतिविधि की शाखाओं के नाम;

आइटम, सामग्री;

तरीके, प्रक्रियाएं, संचालन, घटनाएं;

गुण, मान, पैरामीटर, विशेषताएँ;

रिश्ते, संरचनाएं, मॉडल, कानून, नियम, अमूर्त अवधारणाएं।

पदानुक्रमित सूचकांक। एक पदानुक्रमित सूचकांक एक सूचकांक है जो वर्णनकर्ताओं की सूचियों की एक सूची देता है, प्रत्येक सूची एक ऐसे वर्णनकर्ता से शुरू होती है जिसका कोई माता-पिता नहीं है। यह आईपीटी में पदानुक्रमित संबंधों की पूरी संरचना को दर्शाता है। प्रत्येक डिस्क्रिप्टर के बाद, डिस्क्रिप्टर को सीधे स्तर के क्रमांकन या ग्राफिक पदनाम का उपयोग करके पदानुक्रम में उनके स्तर के संकेत के साथ दिया जाता है:

आईपीटी का एक पदानुक्रमित सूचकांक विकसित करने की आवश्यकता इस तथ्य के कारण है कि अवधारणाओं की अधीनता की पूरी प्रणाली आईपीटी की शब्दकोश प्रविष्टियों में तय नहीं है, क्योंकि इससे लेक्सिको-सिमेंटिक इंडेक्स में उल्लेखनीय वृद्धि होगी। IPT के एक स्वतंत्र खंड को विकसित करने की आवश्यकता है - एक पदानुक्रमित सूचकांक जो नीचे तक वर्णनकर्ताओं की अधीनता की संपूर्ण श्रेणीबद्ध श्रृंखला को प्रतिबिंबित करेगा।

एक क्रमपरिवर्तनीय सूचकांक एक सूचकांक है जो वर्णानुक्रम में उन सभी व्यक्तिगत शब्दों को सूचीबद्ध करता है जो वर्णनकर्ताओं को दर्शाने वाले वाक्यांशों के घटकों का हिस्सा हैं और उनमें से प्रत्येक के लिए इन शब्दों को शामिल करने वाले सभी विवरणकों को इंगित किया जाता है। इसलिए, प्रत्येक पद क्रमपरिवर्तनीय सूचकांक में उतनी ही बार प्रकट होता है, जितनी बार उसमें महत्वपूर्ण शब्द होते हैं। क्रमपरिवर्तनीय सूचकांक का उद्देश्य वर्णनकर्ताओं-वाक्यांशों को उनकी रचना में शामिल किसी भी शब्द द्वारा खोज प्रदान करना है, जिसमें वे भी शामिल हैं जो एक शाब्दिक इकाई की शुरुआत में प्रकट नहीं होते हैं। यह आपको एकल-रूट शब्दों को एक स्थान पर समूहित करने की अनुमति देता है।

एक नियम के रूप में, एक क्रमपरिवर्तनीय सूचकांक को स्वचालित तरीके से संकलित किया जाता है और आमतौर पर KWIC प्रकार के सूचकांक का रूप होता है (कुंजी शब्द - संदर्भ में - "संदर्भ में कीवर्ड"), जिसमें सभी सार्थक शब्द - शब्द - व्यवस्थित होते हैं वर्णमाला क्रम में। क्रमचय सूचकांक में स्तंभ के केंद्र में होता है, जो कि शब्द तत्वों के सूक्ष्म संदर्भों द्वारा बनता है, और शब्दों का वह भाग जो फिट नहीं होता है, उसी पंक्ति के बाईं ओर स्थानांतरित किया जाता है:

ऑप्टिकल क्वांटम

कामोत्तेजना

विद्युतीय

आश्रित उत्तेजना के साथ

हस्तक्षेप जेनरेटर

सीरियल जेनरेटर

डीसी जनरेटर

डीसी जेनरेटर जरूरी साबित होते हैं।

4. आईपीटी के विकास, परीक्षा, पंजीकरण और रखरखाव की प्रक्रिया

वर्तमान में, आईपीटी के विकास, परीक्षा और पंजीकरण की प्रक्रिया दो मानकों द्वारा निर्धारित की जाती है: GOST 7.25-2001 "सूचना पुनर्प्राप्ति थिसॉरस मोनोलिंगुअल। विकास नियम, संरचना, संरचना और प्रस्तुति प्रपत्र" और GOST 7.24-2007 "बहुभाषी सूचना पुनर्प्राप्ति थिसॉरस। निर्माण के लिए संरचना, संरचना और बुनियादी आवश्यकताएं। इन मानकों के अनुसार, आईपीटी की परीक्षा और पंजीकरण के कार्य राष्ट्रीय और अंतर्राष्ट्रीय डिपॉजिटरी फंड द्वारा किए जाते हैं।

रूसी में आईपीटी का राष्ट्रीय डिपॉजिटरी फंड (आईपीटी सहित रूसी में डिस्क्रिप्टर के समकक्ष) VINITI में स्थित है।

दो अंतरराष्ट्रीय डिपॉजिटरी आईपीटी भी हैं:

1) अंग्रेजी में आईपीटी इंटरनेशनल डिपॉजिटरी फंड, आईपीटी सहित अंग्रेजी में डिस्क्रिप्टर के समकक्ष। यह टोरंटो में, टोरंटो विश्वविद्यालय में सूचना विज्ञान संकाय के पुस्तकालय में स्थित है (थिसॉरस क्लियरिंगहाउस - "निपटान", पुस्तकालय, सूचना अध्ययन संकाय, टोरंटो विश्वविद्यालय, टोरंटो, कनाडा);

2) अंग्रेजी के अलावा अन्य सभी भाषाओं में आईपीटी इंटरनेशनल डिपॉजिटरी फंड। यह वारसॉ में, वैज्ञानिक और तकनीकी और आर्थिक जानकारी में स्थित है (Instytut Informacji Naukowej, Technicznej i Ekonomicznej, Clearinghouse, WARSZAW A, पोलैंड।)।

इन संगठनों का पूरा पता GOST 7.25-2001 में दिया गया है।

GOST 7.25-2001 और GOST 7.24-2007 आईपीटी डेवलपर्स के कार्यों को निम्नानुसार परिभाषित करते हैं:

1. एक आईपीटी के निर्माण पर काम शुरू करने से पहले, डेवलपर को किसी दिए गए विषय पर पंजीकृत थिसॉरी की उपलब्धता का निर्धारण करने के लिए उपयुक्त राष्ट्रीय या अंतरराष्ट्रीय डिपॉजिटरी फंड में आवेदन करना होगा। ऐसे थिसॉरी की उपस्थिति में, उन्हें किसी दिए गए सिस्टम में पेश करने की संभावना का आकलन किया जाता है। यदि ऐसी कोई थिसॉरी नहीं मिलती है, तो आईपीटी का निर्माण संभव हो सकता है। उसी समय, IPT बनाने की पूरी तकनीक को GOST 7.25-2001 और GOST 7.24-2007 का कड़ाई से पालन करना चाहिए।

2. समाप्त (विकसित) IPT को GOST 7.25-2001 के अनुपालन के लिए एक परीक्षा से गुजरना होगा। वे मानक को पूरा करते हैं, फिर राष्ट्रीय डेवलपर जारी करता है। इस आईपीटी को संबंधित राष्ट्रीय या अंतरराष्ट्रीय डिपॉजिटरी फंड (टोरंटो या वारसॉ में) में जमा (जमा) किया जाता है।

राष्ट्रीय डिपॉजिटरी जमा किए गए आईपीटी के फंड की संरचना के बारे में जानकारी का प्रसार करते हैं और तत्वों को उधार लेने और विभिन्न सूचना प्रणालियों के भाषाई समर्थन की अनुकूलता सुनिश्चित करने के लिए उन्हें नए आईपीटी के डेवलपर्स को प्रदान करते हैं। इस प्रकार, वे परीक्षा, पंजीकरण, आईपीटी के भंडारण और उपलब्ध आईपीटी के बारे में जानकारी का कार्य करते हैं।

आईपीटी के प्रबंधन के लिए कई संचालन);

स्वतंत्र संचालन से नेटवर्क संचालन के लिए एआईएस का संक्रमण (उनके रखरखाव के एकल सिद्धांत के ढांचे के भीतर आईपीटी का उपयोग करते समय, उन्हें सहमत होना चाहिए)।

IPT को ऊपर और चालू रखने की प्रक्रिया को थिसॉरस को बनाए रखना या समायोजित करना कहा जाता है। इसमें आमतौर पर निम्नलिखित शामिल हैं:

आईपीटी की शब्दावली संरचना को बदलना: नई शब्दावली इकाइयों को पेश करना, उनकी, शब्दावली इकाइयों की स्थिति बदलना (किसी कीवर्ड को डिस्क्रिप्टर में अनुवाद करना और इसके विपरीत);

आईपीटी में प्रतिमानात्मक संबंधों में परिवर्तन (मजबूत करना, कमजोर करना);

आईपीटी को बनाए रखने में ऑटोमेशन टूल्स का अनिवार्य उपयोग शामिल है जो आपको ऐसे श्रम-गहन संचालन को जल्दी से करने की अनुमति देता है जैसे कि शब्दकोश, शब्दावली, पारस्परिकता और संदर्भों की स्थिरता की जांच करना, जिसकी सहायता से आईपीटी में प्रतिमान संबंध तय किए जाते हैं। , आदि।

, विलोम, पर्यायवाची, सम्मोहन, हाइपरनिम्स, आदि) शाब्दिक इकाइयों के बीच। व्यक्तिगत विषय क्षेत्रों का वर्णन करने के लिए थिसॉरी सबसे प्रभावी उपकरणों में से एक है।

अतीत में, शब्द कोशशब्दकोशों को मुख्य रूप से नामित किया गया था, जो अधिकतम पूर्णता के साथ ग्रंथों में इसके उपयोग के उदाहरणों के साथ भाषा की शब्दावली का प्रतिनिधित्व करते हैं।

इसके अलावा टर्म कोशविषय के पास मौजूद सभी सूचनाओं की समग्रता को संदर्भित करने के लिए सूचना सिद्धांत में उपयोग किया जाता है।

मनोविज्ञान में, किसी व्यक्ति का थिसॉरस सूचना की धारणा और समझ की विशेषता है। संचार सिद्धांत एक जटिल प्रणाली के सामान्य थिसॉरस पर भी विचार करता है, जिसके माध्यम से इसके तत्व परस्पर क्रिया करते हैं।

कहानी

पहले थिसॉरी में से एक को फिलो ऑफ बिब्लस द्वारा समानार्थक शब्दकोष कहा जाता है। शब्द के लिए एक अधिक सटीक पत्राचार अमारा-कोश है, जो 6 वीं शताब्दी में पद्य रूप में संस्कृत में लिखा गया है। पहला आधुनिक अंग्रेजी थिसॉरस 1805 में पीटर मार्क रोजर द्वारा बनाया गया था। यह 1852 में प्रकाशित हुआ था और तब से इसका उपयोग किया जा रहा है।

1970 के दशक में, सूचना पुनर्प्राप्ति कार्यों के लिए थिसॉरी का सक्रिय रूप से उपयोग किया जाने लगा। ऐसे थिसॉरी में, शब्दों की तुलना वर्णनकर्ताओं से की जाती है, जिसके माध्यम से शब्दार्थ लिंक स्थापित होते हैं।

शब्दकोष संबंधी

यह सभी देखें

"थिसॉरस" लेख पर एक समीक्षा लिखें

टिप्पणियाँ

थिसॉरस की विशेषता वाला एक अंश

- आज तुम क्या बांका हो! - अपने नए मानसिक और काठी के कपड़े को देखते हुए, नेस्वित्स्की ने कहा।
डेनिसोव मुस्कुराया, ताशका से एक रूमाल निकाला, जिससे इत्र की गंध फैल गई, और नेस्वित्स्की की नाक में डाल दिया।
- मैं नहीं कर सकता, मैं काम पर जा रहा हूँ! बाहर निकला, अपने दांत साफ किए और खुद को सुगंधित किया।
एक कोसैक के साथ नेस्वित्स्की की भव्य आकृति, और डेनिसोव की निर्णायकता, जिसने अपने कृपाण को लहराया और सख्त चिल्लाया, का प्रभाव था कि उन्होंने पुल के दूसरी तरफ निचोड़ा और पैदल सेना को रोक दिया। नेस्वित्स्की को बाहर निकलने पर एक कर्नल मिला, जिसे उसे आदेश देना था, और अपना आदेश पूरा करने के बाद, वापस चला गया।
सड़क साफ करने के बाद, डेनिसोव पुल के प्रवेश द्वार पर रुक गया। उसने लापरवाही से उस घोड़े को रोका, जो अपनी ओर भाग रहा था और अपने पैर से लात मार रहा था, उसने स्क्वाड्रन को अपनी ओर बढ़ते हुए देखा।
पुल के बोर्डों पर खुरों की पारदर्शी आवाज़ें सुनाई दे रही थीं, जैसे कि कई घोड़े सरपट दौड़ रहे हों, और स्क्वाड्रन, एक पंक्ति में चार लोगों के सामने अधिकारियों के साथ, पुल के साथ फैला और दूसरी तरफ जाने लगा।
रुके हुए पैदल सेना के सैनिक, पुल द्वारा रौंदी गई कीचड़ में भीड़, साफ-सुथरे, नीरस हुसरों को, उनके पास से गुजरते हुए, अलगाव और उपहास की उस विशेष अमित्र भावना के साथ, जिसके साथ सेना की विभिन्न शाखाएँ आम तौर पर मिलती हैं।
- अच्छे लोग! अगर केवल Podnovinskoye के लिए!
- वे क्या अच्छे हैं! केवल दिखावे और चलाने के लिए! दूसरे ने कहा।
- पैदल सेना, धूल नहीं! - हुसार ने मजाक किया, जिसके तहत घोड़ा, खेल रहा था, पैदल सेना पर कीचड़ उछाला।
"मैं तुम्हें दो संक्रमणों के लिए एक थैले के साथ दूर भगाता, फीते खराब हो जाते," पैदल सेना ने अपनी आस्तीन से अपने चेहरे से गंदगी को पोंछते हुए कहा; - नहीं तो यह कोई व्यक्ति नहीं है, बल्कि एक पक्षी बैठा है!
"बेहतर होगा कि आपको घोड़े पर बिठाया जाए, ज़िकिन, अगर आप निपुण थे," कॉर्पोरल ने पतले सैनिक पर मज़ाक किया, जो थैले के वजन से मुड़ गया था।
"अपने पैरों के बीच एक डंडा लो, यहाँ तुम्हारे लिए एक घोड़ा है," हुसार ने उत्तर दिया।

बाकी पैदल सेना प्रवेश द्वार पर भंवर करते हुए, पुल के पार चली गई। अंतत: गाडिय़ां सभी गुजर गईं, क्रश कम हो गया और अंतिम बटालियन पुल में प्रवेश कर गई। डेनिसोव के स्क्वाड्रन के कुछ हुसार दुश्मन के खिलाफ पुल के दूसरी तरफ बने रहे। दुश्मन, विपरीत पहाड़ से, नीचे से, पुल से दूरी में दिखाई दे रहा था, अभी तक दिखाई नहीं दे रहा था, क्योंकि जिस खोखले से नदी बहती थी, क्षितिज विपरीत ऊंचाई के साथ समाप्त हो गया था, आधे से अधिक नहीं। आगे एक रेगिस्तान था, जिसके साथ कुछ जगहों पर हमारे यात्रा करने वाले Cossacks के समूह चल रहे थे। अचानक, सड़क के विपरीत ऊंचाई पर, नीले हुड और तोपखाने में सैनिक दिखाई दिए। ये फ्रांसीसी थे। Cossacks की टुकड़ी नीचे की ओर एक ट्रोट पर चली गई। डेनिसोव के स्क्वाड्रन के सभी अधिकारी और लोग, हालांकि उन्होंने अजनबियों के बारे में बात करने और चारों ओर देखने की कोशिश की, उन्होंने केवल पहाड़ पर क्या था, इसके बारे में सोचना बंद नहीं किया, और लगातार क्षितिज पर दिखाई देने वाले धब्बे में देखा, जिसे उन्होंने पहचाना दुश्मन सेना। दोपहर में मौसम फिर से साफ हो गया, डेन्यूब और उसके आसपास के अंधेरे पहाड़ों पर सूरज चमकने लगा। वह शांत था, और उस पहाड़ से कभी-कभी शत्रु के सींग और चीख-पुकार की आवाजें आती थीं। छोटी साइडिंग के अलावा स्क्वाड्रन और दुश्मन के बीच कोई नहीं था। एक खाली जगह, तीन सौ थाह, ने उन्हें उससे अलग कर दिया। दुश्मन ने फायरिंग बंद कर दी, और उस सख्त, दुर्जेय, अभेद्य और मायावी विशेषता जो दो दुश्मन सैनिकों को अलग करती है, सभी को और अधिक स्पष्ट रूप से महसूस किया गया।
"इस रेखा से एक कदम आगे, जीवित को मृतकों से अलग करने वाली रेखा की याद ताजा करती है, और - पीड़ा और मृत्यु का अज्ञात। और वहां क्या है? वहाँ कौन है? वहाँ, इस मैदान के पीछे, और एक पेड़, और एक छत सूरज की रोशनी में? कोई नहीं जानता, और कोई जानना चाहता है; और इस रेखा को पार करना डरावना है, और मैं इसे पार करना चाहता हूं; और आप जानते हैं कि देर-सबेर आपको इसे पार करना होगा और पता लगाना होगा कि रेखा के दूसरी तरफ क्या है, जैसे मृत्यु के दूसरी तरफ क्या है, यह पता लगाना अनिवार्य है। और वह खुद मजबूत, स्वस्थ, हंसमुख और चिड़चिड़ा है, और ऐसे स्वस्थ और चिड़चिड़े लोगों से घिरा हुआ है। तो अगर वह नहीं सोचता है, तो हर व्यक्ति जो दुश्मन की दृष्टि में है, महसूस करता है, और यह भावना इन क्षणों में होने वाली हर चीज को छापों की एक विशेष चमक और आनंदमय तेज देती है।
एक शॉट का धुआँ दुश्मन के पास एक पहाड़ी पर दिखाई दिया, और गेंद सीटी बजाते हुए, हुसार स्क्वाड्रन के सिर के ऊपर से उड़ गई। जो अधिकारी एक साथ खड़े थे, वे अपने स्थानों पर तितर-बितर हो गए। हुसारों ने लगन से घोड़ों को सीधा करना शुरू किया। स्क्वाड्रन में सब कुछ चुप हो गया। हर कोई दुश्मन और स्क्वाड्रन कमांडर पर कमान की प्रतीक्षा कर रहा था। एक और, तीसरा कोर उड़ गया। यह स्पष्ट है कि उन्होंने हुसारों पर गोलियां चलाईं; लेकिन तोप का गोला, समान रूप से तेजी से सीटी बजाते हुए, हुसारों के सिर के ऊपर से उड़ गया और कहीं पीछे से टकरा गया। हुसर्स ने पीछे मुड़कर नहीं देखा, लेकिन एक उड़ने वाली तोप के गोले की हर आवाज़ पर, जैसे कि कमान पर, अपने नीरस रूप से विविध चेहरों के साथ पूरी स्क्वाड्रन, तोप के गोले के उड़ने के दौरान अपनी सांस रोककर, रकाब में उठी और फिर से नीचे गिर गई। सैनिकों ने बिना सिर घुमाए एक-दूसरे की ओर देखा, उत्सुकता से एक कॉमरेड की छाप की तलाश कर रहे थे। डेनिसोव से लेकर बुगलर तक, होठों और ठुड्डी के पास, हर चेहरे पर संघर्ष, जलन और उत्तेजना का एक सामान्य लक्षण दिखाई दिया। हवलदार-मेजर ने सैनिकों की ओर देखा, मानो सजा की धमकी दे रहे हों। जंकर मिरोनोव कोर के प्रत्येक मार्ग के साथ नीचे गिर गया। रोस्तोव, अपने स्पर्श किए गए लेकिन दृश्यमान ग्रेचिक पर बाईं ओर खड़े थे, एक परीक्षा के लिए एक बड़े दर्शकों के सामने बुलाए गए एक छात्र की खुश नज़र थी, जिसमें उसे यकीन था कि वह उत्कृष्ट होगा। उसने चारों ओर स्पष्ट रूप से और उज्ज्वल रूप से सभी को देखा, मानो उनसे ध्यान देने के लिए कह रहा हो कि वह कैसे तोप के गोले के नीचे शांति से खड़ा है। लेकिन उनके चेहरे में भी कुछ नया और सख्त, उनकी मर्जी के खिलाफ, मुंह के पास ही दिखाया गया था।
- वहां कौन झुकता है? युनकेग "मिग" ऑन! Hexog "ओह, मुझे देखो" इसे! - डेनिसोव चिल्लाया, जो अभी भी खड़ा नहीं हो सकता था और जो स्क्वाड्रन के सामने घोड़े पर घूम रहा था।
वास्का डेनिसोव का छोटा और काले बालों वाला चेहरा और उसका छोटा, नॉक-डाउन फिगर, उसके पापी (बालों से ढकी छोटी उंगलियों के साथ) हाथ, जिसमें उसने एक खींचे हुए कृपाण की मूठ पकड़ रखी थी, बिल्कुल वैसा ही था जैसा कि हमेशा, खासकर शाम को, दो बोतल पीने के बाद। वह सामान्य से केवल लाल था, और, जब वे पीते हैं, तो अपने झबरा सिर को पक्षियों की तरह फेंकते हुए, अपने छोटे पैरों के साथ अच्छे बेडौइन के किनारों में अपने स्पर्स को बेरहमी से दबाते हुए, वह, जैसे वापस गिर रहा था, दूसरी तरफ सरपट भाग गया। स्क्वाड्रन और कर्कश आवाज में पिस्तौल का निरीक्षण करने के लिए चिल्लाया। वह कर्स्टन के पास गया। स्टाफ कप्तान, एक चौड़ी और शांत घोड़ी पर, तेज गति से डेनिसोव की ओर बढ़ा। कप्तान का स्टाफ, उसकी लंबी मूंछों के साथ, हमेशा की तरह गंभीर था, केवल उसकी आँखें सामान्य से अधिक चमकती थीं।
- हाँ क्या? - उसने डेनिसोव से कहा, - यह लड़ाई में नहीं आएगा। आप देखेंगे, चलो वापस चलते हैं।
- चोग "नहीं जानता कि वे क्या कर रहे हैं," डेनिसोव बड़बड़ाया। "आह! जी" कंकाल! वह कैडेट को चिल्लाया, उसका हंसमुख चेहरा देखकर। - अच्छा, मैंने इंतजार किया।
और वह अनुमोदन से मुस्कुराया, जाहिरा तौर पर जंकर पर आनन्दित हुआ।
रोस्तोव पूरी तरह से खुश महसूस कर रहा था। इस समय, प्रमुख पुल पर दिखाई दिए। डेनिसोव उसके पास सरपट दौड़ा।
- आपका पीजी "ऊंचाई! मुझे हमला करने दो! मैं उन्हें उन पर फेंक दूंगा।"
"किस तरह के हमले होते हैं," प्रमुख ने सुस्त आवाज में कहा, एक कष्टप्रद मक्खी से जीतते हुए। "और तुम यहाँ क्यों खड़े हो?" देखिए, फ़्लैंकर पीछे हट रहे हैं। स्क्वाड्रन का नेतृत्व करें।
स्क्वाड्रन ने पुल पार किया और एक भी व्यक्ति को खोए बिना शॉट्स के नीचे से निकल गया। उसके पीछे, दूसरा स्क्वाड्रन, जो श्रृंखला में था, भी पार हो गया, और आखिरी कोसैक्स ने उस तरफ साफ कर दिया।
पावलोग्राद निवासियों के दो स्क्वाड्रन, पुल को पार करके, एक के बाद एक, पहाड़ पर वापस चले गए। रेजिमेंटल कमांडर कार्ल बोगदानोविच शुबर्ट डेनिसोव के स्क्वाड्रन तक पहुंचे और रोस्तोव से दूर नहीं, उस पर कोई ध्यान नहीं दिया, इस तथ्य के बावजूद कि तेल्यानिन पर पिछले संघर्ष के बाद, उन्होंने अब पहली बार एक-दूसरे को देखा। रोस्तोव, एक ऐसे व्यक्ति की शक्ति में सबसे आगे महसूस कर रहा था, जिसे अब वह खुद को दोषी मानता था, उसने एथलेटिक पीठ, गोरा नप और रेजिमेंटल कमांडर की लाल गर्दन से अपनी आँखें नहीं हटाईं। रोस्तोव को ऐसा लग रहा था कि बोगदानिच केवल असावधान होने का नाटक कर रहा था, और उसका पूरा लक्ष्य अब कैडेट के साहस की परीक्षा लेना था, और वह सीधा हो गया और चारों ओर खुशी से देखा; तब उसे लगा कि बोगदानिच जानबूझकर रोस्तोव को अपनी हिम्मत दिखाने के लिए उसके पास जा रहा था। तब उसने सोचा कि उसका दुश्मन अब जानबूझकर एक स्क्वाड्रन को एक हताश हमले में भेज देगा ताकि उसे रोस्तोव को दंडित किया जा सके। यह सोचा गया था कि हमले के बाद वह उसके पास आएगा और उदारता से उसे, घायल व्यक्ति, सुलह का हाथ बढ़ाएगा।

नीचे कोशशब्दकोश प्रकार के एक जटिल घटक के रूप में समझा जाता है, जिसमें शब्दकोश के सभी अर्थ शब्दार्थ संबंधों से जुड़े होते हैं जो ज्ञान के वर्णित विषय क्षेत्र में अवधारणाओं के मुख्य संबंधों को दर्शाते हैं। अतीत में, शब्द थिसॉरस मुख्य रूप से ऐसे शब्दकोशों को निरूपित करता था जो ग्रंथों में इसके उपयोग के उदाहरणों के साथ भाषा की शब्दावली को अधिकतम पूर्णता के साथ दर्शाते थे।

थिसॉरस में शामिल हैं टोकनभाषण के चार भागों से संबंधित: विशेषण, संज्ञा, क्रिया और क्रिया विशेषण। भाषण के प्रत्येक भाग के अनुरूप विवरण की एक अलग संरचना होती है।

थिसॉरस में मुख्य संबंध हैं:

  • समानार्थी शब्द- भाषण के एक ही भाग के शब्दों के बीच संबंध, ध्वनि और वर्तनी में भिन्न, लेकिन समान या बहुत करीबी शाब्दिक अर्थ, उदाहरण के लिए: घुड़सवार सेना - घुड़सवार सेना, बहादुर - बहादुर;
  • एंटोनिमी- भाषण के एक भाग के शब्दों के बीच संबंध, ध्वनि में भिन्न, सीधे विपरीत अर्थ वाले: सत्य - झूठ, अच्छा - बुरा;
  • हाइपोनीमी / हाइपरनेमी। हाइपरनिम- एक व्यापक अर्थ वाला एक शब्द, एक सामान्य, सामान्य अवधारणा, वस्तुओं के एक वर्ग (सेट) का नाम (गुण, विशेषताएं) व्यक्त करता है। हाइपोनिम- एक संक्षिप्त अर्थ वाला एक शब्द, किसी वस्तु (संपत्ति, विशेषता) को एक वर्ग (सेट) के तत्व के रूप में नामित करना। ये संबंध सकर्मक और असममित हैं। हाइपोनिम को हाइपरनिम के सभी गुण विरासत में मिलते हैं। संज्ञाओं का वर्णन करने के लिए वे केंद्रीय संबंध हैं;
  • मेरोनिमी/पार्टोनीमी- संबंध "भाग-संपूर्ण"। इस संबंध के भीतर, संबंध "एक तत्व होने के लिए" और "बनने के लिए" बाहर खड़े हैं। संबंध केवल संज्ञाओं के लिए परिभाषित किया गया है;
  • परिणाम (यह संबंध क्रियाओं को जोड़ता है);
  • कारण (क्रिया के लिए भी परिभाषित)।

थिसॉरस उदाहरण:

इज़्बा - एक लकड़ी का किसान घर [हाइपरनाम]: आवासीय भवन [उपनाम]: ग्रामीण बस्ती [पर्यायवाची]: घर

सभी संबंध अवधारणाओं का एक जटिल पदानुक्रमित नेटवर्क बनाते हैं, और यह जानना कि उस नेटवर्क में एक अवधारणा कहां है, उस अवधारणा के बारे में जानने का एक महत्वपूर्ण हिस्सा है। भाषण के विभिन्न भागों का वर्णन करते समय संबंधों के गुण भिन्न होते हैं।

एक थिसॉरस विभिन्न प्रणालियों में विभिन्न कार्य कर सकता है:

  • एक संकीर्ण या व्यापक विषय क्षेत्र में विशेष ज्ञान का स्रोत, विषय क्षेत्र की शब्दावली का वर्णन और व्यवस्थित करने का एक तरीका;
  • सूचना पुनर्प्राप्ति प्रणाली में खोज उपकरण;
  • सूचना पुनर्प्राप्ति प्रणाली (तथाकथित नियंत्रण शब्दकोश) में दस्तावेजों के मैनुअल अनुक्रमण के लिए एक उपकरण;
  • पाठ अनुक्रमण उपकरण।

रोजर (या रोजेट, एक अंग्रेजी भौतिक विज्ञानी), जिन्होंने अंग्रेजी भाषा की शब्दावली को समूहों में व्यवस्थित किया, ने वैचारिक शब्दकोशों के रूप में थिसॉरी की नींव रखी। प्रत्येक समूह को एक अवधारणा ("श्रेणियां" के नाम से दर्शाया जाता है, जिनमें से पहले एक हजार थे; ये वर्णानुक्रम में व्यवस्थित सामान्य शब्द हैं, उदाहरण के लिए, पुष्टि ... एजेंसी ...), इसके समानार्थक शब्द के बाद भाषण के कुछ हिस्सों (संज्ञा, क्रिया, विशेषण, क्रियाविशेषण), विलोम, और फिर संबंधित शब्दों की सूची (कई हैं, और कुछ अन्य श्रेणियों के नामों के संदर्भ हैं, जो शब्दकोश प्रविष्टि में "दूर के रिश्तेदारों" की सूची है। " जारी रख सकते हैं, उदाहरण के लिए, एजेंसी से ... व्यापार देखें)। 1852 में रोजर के थिसॉरस के प्रकाशन के बाद से। और विभिन्न रूपों में इसके पुनर्मुद्रण और विभिन्न उपयोगकर्ताओं के लिए अभी भी जारी है, थिसॉरस लगातार नई शब्दावली और कनेक्शन के साथ अद्यतन किया जाता है, लेकिन सभी विकल्पों के पीछे पहले संस्करण के निर्माता का नाम रहता है। इस थिसॉरस का मूल्य इसकी स्वाभाविकता में है, जिसमें यह भाषा की संपूर्ण शब्दावली का वर्णन है, न कि केवल शब्दावली, बल्कि इस तथ्य में भी कि इसका उपयोग सूचना पुनर्प्राप्ति प्रणालियों में शब्दार्थ को बढ़ाने के साधन के रूप में किया जा सकता है। प्रणाली की शक्ति।

थिसौरी अभी भी मानव धारणा के लिए उपयुक्त विषय क्षेत्र के ज्ञान का वर्णन करने का सबसे स्वीकृत रूप है। आधुनिक विदेशी थिसॉरी के उदाहरण वर्डनेट और यूरोवर्डनेट हैं।

वर्डनेट अंग्रेजी थिसॉरस 1990 में दिखाई दिया। और स्वचालित वर्ड प्रोसेसिंग के विभिन्न क्षेत्रों में सक्रिय रूप से संलग्न होना शुरू कर दिया। वर्डनेट में लगभग 100 हजार विभिन्न इकाइयां शामिल हैं (जिनमें से लगभग आधे वाक्यांश हैं), 70,000 अवधारणाओं में व्यवस्थित हैं।

एक बहुभाषी यूरोवर्डनेट थिसॉरस वर्तमान में विकसित किया जा रहा है। प्रारंभ में, चार भाषाओं (डेनिश, इतालवी, स्पेनिश और अमेरिकी अंग्रेजी) के लिए, शब्द अर्थों का एक नेटवर्क विकसित किया गया है जो शब्दार्थ संबंधों से जुड़ा है और विभिन्न भाषाओं में समान शब्दों को खोजने की अनुमति देता है। रोजर थिसॉरस और वर्डनेट नेटवर्क के विपरीत, जो अंग्रेजी भाषा की शाब्दिक और वैचारिक प्रणाली का वर्णन करने के लिए बनाए गए थे, यूरोवर्डनेट मुख्य रूप से ग्रंथों के बड़े सरणियों के स्वचालित प्रसंस्करण की व्यावहारिक समस्याओं को हल करने के लिए बनाया गया है। इस थिसॉरस की सहायता से हल किए जाने वाले सबसे महत्वपूर्ण कार्य निम्नलिखित हैं:

  • बहुभाषी सूचना पुनर्प्राप्ति का प्रावधान;
  • सूचना पुनर्प्राप्ति की पूर्णता में वृद्धि;
  • प्राकृतिक भाषा में एक प्रश्न तैयार करना;
  • दस्तावेजों का सिमेंटिक इंडेक्सिंग, आदि।

इन संबंधों के अलावा, विषयगत संबंध भी पेश किए जाते हैं जो एक विषय क्षेत्र की अवधारणाओं को जोड़ते हैं। यह अवधारणाओं के बीच संबंधों पर विशेष अंक लगाने की भी योजना है, जो संबंधों के संयोजन या संयोजन को दर्शाता है। यदि नेटवर्क में एक अवधारणा में एक ही नाम के कई संबंध हैं, तो वे असंबद्ध हो सकते हैं, अर्थात, इनमें से एक संबंध वास्तव में महसूस किया जाता है, या संयोजन, अर्थात, ये सभी संबंध अवधारणा के लिए मान्य हैं।

घरेलू संस्थानों में सौ से अधिक शाखा थिसॉरी बनाई गई हैं जो इस प्रकार के शब्दकोशों के लिए एक निश्चित राज्य मानक को पूरा करती हैं। उन्हें तथाकथित - आईपीटी - सूचना पुनर्प्राप्ति थिसॉरी कहा जाता है। अवधारणाओं के बीच सभी संभावित शब्दार्थ संबंधों में से, उनमें से तीन निश्चित हैं: पर्यायवाची, सामान्य (जिसमें आमतौर पर "पार्ट-होल" संबंध शामिल होता है) और "अन्य सभी", जिन्हें साहचर्य भी कहा जाता है।

मानक आईपीटी मुख्य रूप से दस्तावेज़ों की मैन्युअल अनुक्रमण के साथ-साथ खोज क्वेरी तैयार करने और अलग-अलग करने के लिए अभिप्रेत हैं। गैर-मानक थिसॉरी हैं, जो ज्ञान के एक विशेष क्षेत्र में शब्दावली के चयनात्मक व्यवस्थितकरण का कार्य निर्धारित करते हैं - यह नए विषय क्षेत्रों के लिए विशेष रूप से सच है। शब्दों की परिभाषाओं के साथ थिसॉरी को समृद्ध करने की प्रवृत्ति बढ़ रही है, जो अस्पष्ट शब्दों के बीच अंतर करने के लिए महत्वपूर्ण है, विशेष रूप से संबंधित विषयों के मामले में और संकीर्ण विषय क्षेत्रों की सीमाओं से परे जाने पर।