Proses ini dilakukan untuk mengidentifikasi dan memberikan makna terhadap unstructured data agar mudah diolah pada tahap selanjutnya. Ada tujuh teknik dalam text mining, yaitu information extraction, information retrieval, natural language processing, clustering, categorization, visualization, dan text summarization.