Для парсинга HTML
я решил использовать библиотеку htmlagilitypack.
Скачать ее можно здесь(http://htmlagilitypack.codeplex.com/)
После скачивания не забываем подключить dll к нашему
проекту.
Ниже приведен пример кода использования данной утилиты:
htmlCode = WebUtility.HtmlDecode(htmlCode); HtmlAgilityPack.HtmlDocument result = new HtmlAgilityPack.HtmlDocument(); result.LoadHtml(htmlCode); List<HtmlAgilityPack.HtmlNode> list = result.DocumentNode.Descendants().Where (x => (x.Name == "div" && x.Attributes["class"] != null && x.Attributes["class"].Value.Contains("main"))).ToList(); foreach (HtmlAgilityPack.HtmlNode node in list) { rtbTest.Text += node.InnerText + "\n"; }
Комментарии
Отправить комментарий