INFORMATION explosion highlights the need for machines to betterunderstand natural language texts. In this paper,we focus on short texts which refer to texts with limited context. Many applications, such as web search and microblogging services etc., need to handle a large number of short texts.

  Obviously, a betterunderstanding of short texts will bring tremendous value.One of the most important tasks of text understanding is todiscover hidden semantics from texts. Many efforts have beendevoted to this field. For instance,named entity recognition (NER) 1, 2 locates named entities in a text and classifies them into predefined categories such as persons, organizations, locations,  etc. Topic models 3, 4 attempt to recognize “latent topics”,which are represented as probabilistic distributions on words, from a text.

 Entitylinking 5, 6, 7, 8focuses on retrieving   “explicit topics” expressedas probabilistic distributions on an entire knowledgebase. However,  categories,”latent topics”,  as wellas “explicit topics” still havea semantic gap with humans’ mental world. As stated in Psychologist Gregory Murphy’s highlyacclaimed book 9, “concepts are the glue that holdsour mental world together”. Therefore, we define short text understanding as to detect concepts mentioned in a short text. Fig.

 1 demonstratesa typical  strategy for short text understanding which  consists of three steps: 1) text segmentation- divide a short text into a collection of terms  contained in a vocabulary (e.g., “book dis- neyland hotel  california” is segmented as fbook  disneyland hotel californiag); 2) type  detection – determine the types  of terms  and  recognize instances (e.g.

Best services for writing your paper according to Trustpilot

Premium Partner
From $18.00 per page
4,8 / 5
4,80
Writers Experience
4,80
Delivery
4,90
Support
4,70
Price
Recommended Service
From $13.90 per page
4,6 / 5
4,70
Writers Experience
4,70
Delivery
4,60
Support
4,60
Price
From $20.00 per page
4,5 / 5
4,80
Writers Experience
4,50
Delivery
4,40
Support
4,10
Price
* All Partners were chosen among 50+ writing services by our Customer Satisfaction Team

, “disneyland”and “california” are  recognized as instances, while  “book”  is averb and “hotel” a concept); 3) concept labeling – infer the con- cept of each instance (e.g., “disneyland” and “california” referto the  concept  theme  park  and  state  respectively).

 Overall,three concepts are detected from short text “book Disneyland hotel California” using this strategy, namely theme park, hotel, and state in Fig. 1.