Ja połączenia dwóch dataframes na kolumnie, która jest float64 w obu dataframes. Jeszcze Otrzymana połączyła dataframe ma Nans dla wszystkich kolumn, które pochodzą z jednego z dwóch dataframes.
Oto seryjnej:
merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')
Oto informacje dotyczące dwóch dataframes
news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id float64
news_id object
label bool
title object
source object
text object
dtypes: bool(1), float64(1), object(4)
tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0 int64
index int64
tweet_id float64
tweet object
user_screen_name object
user_id object
user_location object
user_verified bool
user_friends_count int64
user_followers_count int64
user_listed_count int64
user_statuses_count int64
user_favourites_count int64
dtypes: bool(1), float64(1), int64(7), object(4)
czego mi brakuje?