您可以使用 merge 将两个数据帧 合并 为一个:
import pandas as pdpd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')
其中 on 指定使用两个连接的数据帧中都存在的字段名称,以及 如何
定义其内部/外部/左/右连接,而外部使用“来自两个框架的键的统一(SQL:完全外部连接)”。由于两个数据框中都具有“
star”列,因此默认情况下将在组合数据框中创建两列star_x和star_y。正如@DanAllan在join方法中提到的那样,您可以通过将后缀作为kwarg传递来修改后缀以进行合并。默认值为
suffixes=('_x','_y')。如果您想做类似
star_restaurant_id和的操作
star_restaurant_review,则可以执行以下操作:
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))
在此链接中详细说明了参数。