Thursday, 21 January 2016

XML : Get image url from xml file

Getting the image url from a xml files seems tricky, in Android Studio. Trying to categorise the image url of 30 RSS Feed xmls, i found that 95% of them are using ".jpg" images and the link alwayas begins with "http", not "www.". So, im tryingto write a piece of code that:

  1. Is getting one node (see xml_part), from the nodelist of "item" nodes of the xml file, into a string.
  2. From the begings of the string reach the point of ".jpg" and cut out the rest of the string.
  3. From that ".jpg" point and backwards reach the "http" point and cut out the rest of the string.
  4. Save the image url for later use.

xml_part

 <item>  <title>Πάνω από 1 στα 3 νοικοκυριά ζει με ετήσιο εισόδημα κάτω από 10.000 ευρώ</title>  <link>http://tvxs.gr/news/ellada/pano-apo-1-sta-3-noikokyria-zei-me-etisio-eisodima-kato-apo-10000-eyro</link>  <description>&lt;p&gt;Συντριπτικά αρνητικές είναι οι προσδοκίες των νοικοκυριών καθώς το 70% αναμένει επιδείνωση της οικονομικής του κατάστασης και μόνο το 5,1% προσδοκά σε βελτίωση των οικονομικών του δυνατοτήτων, όπως προκύπτει από την &lt;strong&gt;έρευνα&lt;/strong&gt; του Ινστιτούτου Μικρών Επιχειρήσεων της &lt;strong&gt;ΓΣΕΒΕΕ&lt;/strong&gt; για το &lt;strong&gt;εισόδημα&lt;/strong&gt; και τις &lt;strong&gt;δαπάνες&lt;/strong&gt; των νοικοκυριών για το &lt;strong&gt;2015&lt;/strong&gt;.&lt;/p&gt; &lt;div class=&quot;field field-type-filefield field-field-article-image&quot;&gt;     &lt;div class=&quot;field-items&quot;&gt;             &lt;div class=&quot;field-item odd&quot;&gt;                     &lt;img src=&quot;http://im2ns5.27210.gr/sites/default/files/imagecache/280x/article/2016/03/194269-ellada-krisi-oikonomia-anergia.jpg&quot; alt=&quot;&quot; title=&quot;&quot;  class=&quot;imagecache imagecache-280x imagecache-default imagecache-280x_default&quot; width=&quot;280&quot; height=&quot;175&quot; /&gt;        &lt;/div&gt;         &lt;/div&gt; &lt;/div&gt; &lt;p&gt;&lt;a href=&quot;http://tvxs.gr/news/ellada/pano-apo-1-sta-3-noikokyria-zei-me-etisio-eisodima-kato-apo-10000-eyro&quot; target=&quot;_blank&quot;&gt;διαβάστε περισσότερα&lt;/a&gt;&lt;/p&gt;</description>  <category domain="http://tvxs.gr/taxonomy/term/2">Ελλάδα</category>  <category domain="http://tvxs.gr/taxonomy/term/78458">ΓΣΕΒΕΕ έρευνα ετήσιο οικογενειακό εισόδημα Δεκέμβριος 2015</category>  <category domain="http://tvxs.gr/taxonomy/term/78459">μείωση εισοδημάτων Ελλάδα νοικοκυριά 2015</category>  <pubDate>Thu, 21 Jan 2016 15:09:50 +0000</pubDate>  <dc:creator>Ειρήνη Ορφανίδου</dc:creator>  <guid isPermaLink="false">194269 at http://tvxs.gr</guid> </item>  

My piece of code

 String WholeNode = nl.item(i).getNodeValue(); int WholeNode_length = WholeNode.length();  for (int WN = 0; WN < WholeNode_length; WN++) {      String JPGChecker = WholeNode.substring(WN,WN+4);          if (JPGChecker.equals(".jpg")) {             WholeNode = WholeNode.substring(0,WN+4);             WholeNode_length = WholeNode.length();         } }  for (int SN = WholeNode_length; SN > 0; SN--) {      String HTTPChecker = WholeNode.substring(SN-4, SN);      if (HTTPChecker.equals("http")) {         WholeNode = WholeNode.substring(SN, WholeNode_length);         WholeNode_length = WholeNode.length();     } }  _item.setImage(WholeNode);  

Doesn't work and can't see why, please help the newbie.

The other 5% of xmlcategorization is in which the image is not .jpg (easily changing the above code include other image formats) and other cases in which the url is not "from the top" but after the "http://www.antikoukou.com/" for ex.

No comments:

Post a Comment