python-如何从给定的字符串中提取字符和数值?

我有以下字符串:

'10000 ABC = 1 DEF'
'1 AM = 0,30$'
'3500 ABC = 1 GTY'
'1000 HUYT=1ABC'
'1 MONET Data = 1 ABC'

我想找到一种灵活的方法来从=的左侧和右侧提取数字和字符串值.我不知道所有可能的字符串值.因此,我无法预定义它们.我唯一知道的是左侧和右侧除以=.

目标是为上述示例获得此结果:

字符串对:

ABC-DEF
AM-$
ABC-GTY
HUYT-ABC
MONET Data-ABC

数字对:

10000-1
1-0.30
3500-1
1000-1
1-1

我试图使用.lstrip(‘…’)和rstrip(“ …”),但它没有给我预期的结果.

最佳答案

删除不需要的字符,并用-替换=.

import re

str = ['10000 ABC = 1 DEF',
    '1 AM = 0,30$',
    '3500 ABC = 1 GTY',
    '1000 HUYT=1ABC',
    '1 MONET Data = 1 ABC']

String_pairs = []
Numeric_pairs = []

for s in str:
    String_pairs.append (re.sub(r'\s*=\s*','-', re.sub(r'\s*\d+(,\d+)?\s*','', s)))
    Numeric_pairs.append (re.sub(r'\s*=\s*','-', re.sub(r'\s*[^\d,=]+\s*','', s)))

print String_pairs
print Numeric_pairs

结果:

['ABC-DEF', 'AM-$', 'ABC-GTY', 'HUYT-ABC', 'MONET Data-ABC']
['10000-1', '1-0,30', '3500-1', '1000-1', '1-1']

或更酷的列表理解(结果相同):

String_pairs = [re.sub(r'\s*=\s*','-', re.sub(r'\s*\d+(,\d+)?\s*','', s)) for s in str]
Numeric_pairs = [re.sub(r'\s*=\s*','-', re.sub(r'\s*[^\d,=]+\s*','', s)) for s in str]