как извлечь с красивой суп вложенного значения класса диапазона?

голоса
-2

Я изо всех сил пытается понять, что это элемент я должен сказать Beautiful Soup, чтобы ломом значение тега «количество», который в этом примере кода является «1,56».

Я вставив ниже фрагменте кода веб-страницы, я хочу переделку:

<td class=line-content>
      <span class=html-tag>
       &lt;div
       <span class=html-attribute-name>
        class
       </span>
       ='
       <span class=html-attribute-value>
        the-price
       </span>
       '
       <span class=html-attribute-name>
        style
       </span>
       ='
       <span class=html-attribute-value>
        margin-top:20px;
       </span>
       '&gt;
      </span>
     </td>
    </tr>
    <tr>
     <td class=line-number value=447>
     </td>
     <td class=line-content>
      <span class=html-tag>
       &lt;span
       <span class=html-attribute-name>
        class
       </span>
       ='
       <span class=html-attribute-value>
        currency
       </span>
       '&gt;
      </span>
      <span class=html-tag>
       &lt;/span&gt;
      </span>
      <span class=html-tag>
       &lt;span
       <span class=html-attribute-name>
        class
       </span>
       ='
       <span class=html-attribute-value>
        amount
       </span>
       '&gt;
      </span>
      1,56
      <span class=html-tag>
       &lt;/span&gt;
      </span>
     </td>
    </tr>

бы вы любезно просветить меня? Я очень благодарен за любую помощь.

Задан 03/12/2019 в 00:01
источник пользователем
На других языках...                            


1 ответов

голоса
1

Вы можете настроить таргетинг на сумму, например , как это ( dataваш HTML строки):

from bs4 import BeautifulSoup
soup = BeautifulSoup(data, 'html.parser')

span_with_amount = soup.find(lambda tag: tag.name == 'span' and tag.get_text(strip=True) == 'amount')
value = span_with_amount.parent.find_next_sibling(text=True)
print(value.strip())

Печать:

1,56

Во- первых , мы найдем <span>с текстом «количество» , а затем мы найдем текст , который находится рядом с родителем этого <span>.

Ответил 03/12/2019 в 00:53
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more